Доверительные интервалы для среднего
Last updated
Was this helpful?
Last updated
Was this helpful?
Построение доверительных интервалов
Целью статистики является возможность сделать выводы относительно ГС основываясь только на выборочных данных. Очень часто исследователя интересует чему равняется среднее значение исследуемого признака во всей ГС.
Исходя из примера, ГС это будет все женщины и мужчины во возрасте [18; 30]. И пригласить всех этих людей непростая задача. К сожалению мы не можем абсолютно точно сказать чему именно равняется средний в ГС. Но мы сможем посчитать такой интервал, относительно которого можем быть уверены в том что он включает интересующий нас параметр.
Для этого нужно знать свойство нормального распределения и центрально предельную теорему.
И так мы знаем, что если бы многократно повторяли наш эксперимент, то все выборочные средние распределились бы нормальным образом вокруг среднего ГС (нас интересует этот параметр) и со стандартной ошибкой среднего . И также знаем что 95% всех выборочных средних по свойству нормального распределения лежали бы в диапазоне нашей средней ГС или в нашем случае .
Мы как раз таки не знаем чему равняется среднее ГС. Но мы можем взглянуть на эту картинку немного по другому.
Предположим что мы рассчитывали бы такой показатель для каждого из выборочных средних. Пусть зеленый столбик выборочное среднее равняется , если бы мы рассчитали интервал для такого выборочного среднего , то как видим, этот интервал включил бы в себя среднее ГС. Если бы мы рассчитали такой интервал для среднего , то такой интервал также включил в себя среднее ГС. Таким образом 95% процентов всех выборочных средних включили бы в себя среднее ГС, если бы рассчитывали такой интервал и только те выборочные средние, которые очень далеко отклонились от среднего ГС например и не включили бы в свой 95% интервал среднее ГС.
Таким образом если бы многократно извлекали бы выборки одинакового размера из ГС, в каждой выборке рассчитывали бы среднее и для него свой 95% доверительный интервал, то в 95% всех случаях такой интервал включал бы в себя среднее ГС.
Рассчитаем доверительный интервал для наших выборных данных.