Меры изменчивости

  • Понятие меры изменчивости данных

  • Размах

  • Дисперсия, стандартное отклонение

  • Свойства дисперсии и стандартного отклонения

Два распределения отличаются по изменчивости

Одна из самых простых мер изменчивости - это размах (range).

Размах (range) - разность максимального и минимального значения.

R=XmaxXminR = X_{max} - X_{min}
Размах

Размах имеет недостаток - оно рассчитывает изменчивость данных, используя только два крайних значений. И изменения одного из крайних значений, будут очень болезненно отражаться на итоговом результате.

Как использовать все без исключения значения признака для расчёта меры изменчивости? Один из вариантов - это посмотреть насколько в среднем наши значения отклоняются от среднего нашей выборки.

Дисперсия (variance) – средний квадрат отклонений индивидуальных значений признака от их средней величины.

Дисперсия для ГС:

D=((XiX)2)nD = \frac{\sum((X_i - \overline{X})^2)}{n}

Дисперсия для Выборки

D=((XiX)2)n1D = \frac{\sum((X_i - \overline{X})^2)}{n - 1}

Среднее квадратическое отклонение - в отличии от дисперсии, показывает реальное среднее значение наших отклонений от среднего по выборке.

σ=D\sigma = \sqrt{D}

Обозначения для ГС и Выборки:

σ=sd\sigma = sd

sd ( standard deviation) - средне квадратическое отклонение или стандартное отклонение.

Дисперсия

Свойства дисперсии:

Dx+c=Dxsdx+c=sdxDxc=Dxc2sdxc=sdxcD_{x + c} = D_x \\ sd_{x+c} = sd_x \\ D_{x*c} = D_x * c^2 \\ sd_{x*c} = sd_x * |c|
Свойства дисперсии

Может ли показатель стандартного отклонения принимать отрицательные значения?

т.к. сумма квадратов

У какого из распределений наибольшая дисперсия?

т.к. отклонения от среднего на 2 гистограмме больше

Last updated

Was this helpful?