Идея статистического вывода, p-уровень значимости

Статистическая проверка гипотез
Идея статистического вывода
p-уровень значимости

При помощи доверительных интервалов мы научились решать статистическую задачу, а именно оценивать неизвестный параметр ГС. Однако это редко когда является самоцелью, в большинстве случаев нас интересует конкретные гипотезы в рамках исследования.

Например:

Различаются ли страны по среднему уровню продолжительности жизни?
Можно ли утверждать, что новое лекарство позволяет ускорить лечение?
Какие факторы оказывают наиболее значительное влияние на уровень экспрессии генов?

Предположим нам известно что на выздоровление при некотором заболевании в среднем требуется 20 дней. Однако мы разработали новый препарат и хотим проверить можно ли сократить этот срок. Мы набрали выборку из 64 пациентов, и опробовали на них новый метод лечения. Оказалось что средний срок выздоровления сократился до 18,5 дней при стандартном отклонении равным 4. Какой вывод можно сделать основываясь на данных?

Введем два очень важных понятия, в нашем исследование между собой будут конкурировать 2 гипотезы:

Нулевая гипотеза $H_0$ - на самом деле никого воздействия наш новый препарат не оказывает и среднее значение ГС тех пациентов кто использует препарат на самом деле не отличается от 20.

Альтернативная гипотеза $H_1$ - наш препарат влияет на скорость выздоровления и что среднее значение ГС тех кто использует препарат не равняется 20.

Предположим что верна нулевая гипотеза, тогда мы знаем что в соответствие с центральной предельной теоремой, если бы мы многократно повторяли наш эксперимент, то выборочные средние распределились бы нормальным образом вокруг среднего ГС (=20) и со стандартной ошибкой среднего $se = \frac{sd}{\sqrt{n}} = \frac{4}{\sqrt{64}} = 0.5$ .

Насколько далеко наше выборочное среднее отклонилось от предполагаемого среднего ГС в единицах стандартного отклонения? Для этого сделаем z-преобразование $z = \frac{\overline{X} - M}{se} = \frac{18,5 - 20}{0,5} = -3$

Это означает что если бы в ГС среднее значение на самом деле равнялось 20, то наше выборочное среднее отклонилось бы от среднего ГС на -3 сигмы в левую сторону

Воспользуемся свойством нормального распределения, чтобы рассчитать вероятность такого или еще больше выраженного отклонения от среднего значения

Заметим что вероятность отклониться от среднего больше чем на 3 стандартных отклонения, причем как в правую так и в левую сторону равняется приблизительно 0.0027.

Итоги. На первом этапе мы предположили что верна нулевая гипотеза. Если это так, тогда все выборочные средние распределились бы нормальным образом вокруг среднего ГС, которое как мы предполагаем равняется 20. В нашем эксперименте однако выборочное среднее оказалось равно 18,5. Зная стандартную ошибку среднего мы смогли посчитать вероятность получить такое или еще более сильно выраженное отклонение, причем как в правую так и в левую. Оказалось что вероятность такого события приблизительно равняется 0.003.

Таким образом основная идея статистического вывода заключается в следующим: сначала мы допускаем что верна нулевая гипотеза, т.е. на самом деле никаких различий в ГС нет. После этого можем рассчитать вероятность того, что мы получили такие или еще более сильно выраженные различия абсолютно случайно. Эта вероятность в статистике называется p-уровень значимости. Считается что если p < 0.05, то можно смело принимать альтернативную гипотезу.

Укажите, какие утверждения относительно p-уровня значимости являются верными. Правильными могут быть все утверждения, некоторые, одно, а может не быть вообще.

Т.к. в нашем исследовании p уровень значимости равен 0,003, то вероятность того, что верна нулевая гипотеза (новый препарат не влияет на скорость выздоровления) также равняется всего-лишь 0,003.
Если бы в исследовании мы получили p=0,9, это означало бы, что верна нулевая гипотеза, и новый препарат не влияет на скорость выздоровления.
Чем меньше p уровень значимости, тем сильнее получаемые различия. Например, если бы p уровень значимости в нашем исследовании был бы равен 0,0001, значит новый препарат еще сильнее бы влиял на скорость выздоровления.
Статистически значимый результат, всегда означает ценный и осмысленный результат.
Вероятность случайно получить такие различия равняется 0,003.
Все утверждения выше неверны.

Ошибка 1 рода - приняли альтернативную гипотезу, хотя верна нулевая.

Ошибка 2 рода - приняли нулевую гипотезу, хотя верна альтернативная.

PreviousДоверительные интервалы для среднего

Last updated 6 years ago