Shad-ml
  • Shad-ml
  • Основы статистики (часть 1)
    • Основы статистики (часть 1)
    • Генеральная совокупность и выборка
    • Типы переменных. Количественные и номинативные переменные
    • Описательная статистика
    • Меры центральной тенденции
    • Меры изменчивости
    • Квартили распределения и график box-plot
    • Нормальное распределение
    • Центральная предельная теорема
    • Доверительные интервалы для среднего
    • Идея статистического вывода, p-уровень значимости
Powered by GitBook
On this page

Was this helpful?

  1. Основы статистики (часть 1)

Меры центральной тенденции

Позволяет нам ответить на вопрос, насколько в принципе высокие значение принимает переменная

PreviousОписательная статистикаNextМеры изменчивости

Last updated 5 years ago

Was this helpful?

  • Мода

  • Медиана

  • Среднее значение

  • Выбор меры центральной тенденции

  • Свойства среднего

Распределение количественного признака, для этого используется гистограмма частот.

Этот график позволяет сделать первое впечатление о том, какая форма распределения нашего количественного признака.

Симметричное распределение - когда большинство наблюдений в центре распределения, и чем дальше мы отклоняемся от середины распределения, тем реже встречаются значения признака.

Мода (mode) – значение признака, которое встречается максимально часто.

Медиана (median) – значение признака, которое делит упорядоченное множество данных пополам.

Среднее значение (mean) – сумма всех значений признака, деленная на количество измеренных значений.

X‾=∑inxin\overline{X} = \frac{\sum_{i}^{n} x_i}{n}X=n∑in​xi​​

Выборочное среднее:

X‾\overline{X} X

Среднее ГС:

MxM_x Mx​

В каких случаях вместо среднего значения лучше использовать моду или медиану в качестве центральной тенденции?

Свойства среднего:

Mx=1n∑xiMx+C=Mx+CMx∗C=Mx∗C∑(xi−Mx)=0M_x = \frac{1}{n} \sum x_i \\ M_{x + C} = M_x + C \\ M_{x*C} = M_x * C \\ \sum(x_i - M_x) = 0Mx​=n1​∑xi​Mx+C​=Mx​+CMx∗C​=Mx​∗C∑(xi​−Mx​)=0

Предположим, вы провели исследование с целью выяснить, какой доход у граждан, проживающих в двух разных городах (по 100 человек из каждого города). Распределение заработной платы изображено на графике. Какую из мер центральной тенденции осмысленнее всего использовать для описания полученных данных?

Ну явно тенденция - это два пика. И соответственно 2 моды отобразят ее лучше, чем серединка между пиками в виде среднего значения и медианы.

Гистограмма частот
Симметричное распределение
Асимметричное распределение
Мода - Dot plot
Медиана
Медиана при четном количестве
Две моды - красные линии
Свойства среднего
Задача