Квартили распределения и график box-plot
Last updated
Last updated
Квантили распределения
Квартили
Box plot
Квантили распределения - это такие значения признака, которые делят упорядоченные данные на некоторое число равных частей.
Кванти́ль в математической статистике — значение, которое заданная случайная величина не превышает с фиксированной вероятностью. Если вероятность задана в процентах, то квантиль называется процентилем или перцентилем.
Например, фраза «90-й процентиль массы тела у новорожденных мальчиков составляет 4 кг» означает, что 90 % мальчиков рождаются с весом меньше, либо равным 4 кг, а 10 % мальчиков рождаются с весом больше 4 кг.
Например, медиана, которая делит наши данные пополам. Также в статистике часто используются квартили распределения - это такие 3 точки, которые делят наши данные на 4 равные части.
Квартили - три значения признака, которые делят упорядоченное множество данных на четыре равные части.
КВАНТиль = квант = quantity = количество
КВАРТиль = кварта = quarter = четверть
2-квантиль = медиана
4-квантиль = квартиль
10-квантиль = дециль
100-квантиль = перцентиль
Используя квартили можно легко описать наше распределение и построить график box-plot.
Box-plot иногда называют "ящик с усами". Центром прямоугольного ящика является медиана (2 квартиль). Верхняя граница - 3 квартиль. Нижняя граница - 1 квартиль.
Если мы рассчитаем разность между 3 и 1 квартилем, то это будет значение - межквартельный размах. Довольно часто в статистике используется в качестве одной из мер изменчивости. Чем шире наш ящик (чем больше межквартельный размах), тем более высока вариативность нашего признака.