# Меры центральной тенденции

* Мода
* Медиана
* Среднее значение
* Выбор меры центральной тенденции
* Свойства среднего

Распределение количественного признака, для этого используется гистограмма частот.

![Гистограмма частот](https://4138034190-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LhHAPwIUaHw_JDcpqVI%2F-LhexpZSEtD8MsDXSz5k%2F-LhezEyWi5x52SC13Hf_%2F2019-06-18_20-27-55.png?alt=media\&token=8c85f8d2-d09d-4745-97c0-a904f11f9157)

Этот график позволяет сделать первое впечатление о том, какая форма распределения нашего количественного признака.

**Симметричное распределение** - когда большинство наблюдений в центре распределения, и чем дальше мы отклоняемся от середины распределения, тем реже встречаются значения признака.

![Симметричное распределение](https://4138034190-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LhHAPwIUaHw_JDcpqVI%2F-LhexpZSEtD8MsDXSz5k%2F-Lhf-J2cSHm0XQIGb_gO%2F2019-06-18_20-32-44.png?alt=media\&token=a6dc40bd-4a72-47af-8e4e-ec2b45920a4a)

![Асимметричное распределение](https://4138034190-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LhHAPwIUaHw_JDcpqVI%2F-LhexpZSEtD8MsDXSz5k%2F-Lhf-kM0xyhaTNTzS6C5%2Fimage.png?alt=media\&token=3e900b3c-aa9c-4cb4-adbf-f1771f70c9bc)

**Мода (mode)** – значение признака, которое встречается максимально часто.

![Мода - Dot plot](https://4138034190-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LhHAPwIUaHw_JDcpqVI%2F-LhexpZSEtD8MsDXSz5k%2F-Lhf1dplrkEYxaUmEAJG%2Fimage.png?alt=media\&token=34a50ed6-9de4-4e8f-8d61-d0b249647981)

**Медиана (median)** – значение признака, которое делит упорядоченное множество данных пополам.

![Медиана](https://4138034190-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LhHAPwIUaHw_JDcpqVI%2F-LhexpZSEtD8MsDXSz5k%2F-Lhf47Wj-JnK8iocXl1x%2Fimage.png?alt=media\&token=87b7c76a-eb67-43ba-9870-ab76302e673e)

![Медиана при четном количестве](https://4138034190-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LhHAPwIUaHw_JDcpqVI%2F-LhexpZSEtD8MsDXSz5k%2F-Lhf4Non-Eu2L7FheGpo%2Fimage.png?alt=media\&token=e86b8f1d-8218-4e43-970c-c238bdf4a42c)

**Среднее значение (mean)** – сумма всех значений признака, деленная на количество измеренных значений.

$$
\overline{X} = \frac{\sum\_{i}^{n} x\_i}{n}
$$

![](https://4138034190-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LhHAPwIUaHw_JDcpqVI%2F-LhexpZSEtD8MsDXSz5k%2F-Lhf7aQCeE9pu0Dwr_7l%2Fimage.png?alt=media\&token=b80b1a4a-f5dc-4176-811a-29fa8c3712f4)

Выборочное среднее:

$$
\overline{X}
$$

Среднее ГС:

$$
M\_x
$$

![Две моды - красные линии](https://4138034190-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LhHAPwIUaHw_JDcpqVI%2F-LhexpZSEtD8MsDXSz5k%2F-Lhf7nSnqv9eIOulJbtb%2Fimage.png?alt=media\&token=ae632b99-3781-4068-a9f8-adae389c23d1)

{% hint style="info" %}
В каких случаях вместо среднего значения лучше использовать моду или медиану в качестве центральной тенденции?

* [x] Если распределение асимметрично
* [x] Если присутствуют заметные выбросы
* [ ] Если распределение является симметричным и унимодальным
  {% endhint %}

**Свойства среднего:**

$$
M\_x = \frac{1}{n} \sum x\_i \\
M\_{x + C} = M\_x + C \\
M\_{x\*C} = M\_x \* C \\
\sum(x\_i - M\_x) = 0
$$

![Свойства среднего](https://4138034190-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LhHAPwIUaHw_JDcpqVI%2F-Lhf8zg1UqYxMyA9GQwy%2F-Lhf9PTnRQ9Lv_r9jGyj%2Fimage.png?alt=media\&token=7a7f9ad1-b88d-4c9c-8f98-c4ac85c2c23d)

![Задача](https://4138034190-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LhHAPwIUaHw_JDcpqVI%2F-Lhf8zg1UqYxMyA9GQwy%2F-Lhf9oDntDae6VrG5IhE%2Fimage.png?alt=media\&token=585b5961-e541-4b97-b4e4-caf659ca1710)

{% hint style="info" %}
Предположим, вы провели исследование с целью выяснить, какой доход у граждан, проживающих в двух разных городах (по 100 человек из каждого города). Распределение заработной платы изображено на графике. Какую из мер центральной тенденции осмысленнее всего использовать для описания полученных данных?

* [x] Мода (моды)
* [ ] Медиана
* [ ] Все три меры дадут приблизительно одинаковый результат
* [ ] Среднее значение

Ну явно тенденция - это два пика. И соответственно 2 моды отобразят ее лучше, чем серединка между пиками в виде среднего значения и медианы.
{% endhint %}
