# Нормальное распределение

* Понятие нормального распределения
* Стандартизация
* Правила двух и трех сигм, использование стандартизации

**Нормальное распределение** - это унимодальное и симметричное распределение, у которого отклонение наблюдений от среднего подчиняются определенному вероятностному закону.

![Нормальное распределение](/files/-Li-sTdUhZVfiDojq3m_)

Интересен тот факт, что в реальным мире, реально распределены нормальным образом. Например, встретить очень высокого человека маловероятно, как и очень низкого. Но гораздо интереснее то, что действительно сохраняется это вероятностное распределение, и этот **вероятностный закон**, также предоставляет очень интересные возможности для статистического анализа.

**z-стандартизация** - это преобразование наших данных, которое позволяет нам любую нашу шкалу перевести на Z шкалу - где среднее значение будет равняться нулю, а стандартное отклонение равняться единице.

$$
M\_x = 0 \\
D\_z = 1
$$

$$
z\_i = \frac{x\_i - \overline{X}}{sd\_x}
$$

Если из каждого наблюдения из нашей выборки отнимем среднее значение, и разделим получившееся выражение на стандартное отклонение, мы получим z-шкалу, где новое новое среднее будет 0, а дисперсия - 1.

![Стандартизация](/files/-Li-sdQch_brYFW6hv_m)

На этом графике результат преобразование наших данных. Как видим не изменилось форма распределения.

![Форма распределения после преобразования](/files/-Li-siyJoSTr6g28g8-p)

{% hint style="info" %}
Выберите верные утверждения:

* [ ] Z значение может быть рассчитано без знания стандартного отклонения по выборке
* [x] Для каждого наблюдения в выборке можно рассчитать соответствующее z значение
* [ ] Если все выборочные значения положительные, то и после z преобразования все значения останутся положительными.
* [x] Если для некоторого наблюдения z значение равняется нулю, следовательно это наблюдение совпадает со средним значением по выборке
  {% endhint %}

*z-преобразование* позволяет ответить на вопрос, какой процент наблюдений лежит в абсолютно любом интересующим нас диапазоне.

![Правило 2 и 3 сигм, таблица нормального распределения](/files/-Li-sqETNDN9Zcg9Oeuq)

![](/files/-Li-u-EpApUFfkfyeFYv)

На рисунке видно, что в пределах одного **среднеквадратического отклонения** лежит 68,26% значений, принимаемых нормально распределенной случайной величиной (соответствует доли площади под кривой распределения). В пределах двух **среднеквадратических отклонений** - уже 95,44%, а в пределах трёх - 99,72%. Это означает, что вероятность того, что случайная величина примет значение, отклоняющееся от математического ожидания больше, чем на три среднеквадратических отклонения, не превышает 0,28%, т.е. пренебрежимо мала.

{% hint style="info" %}
&#x20;Например, пусть имеется выборка наблюдений за ежедневными продажами в магазине. Значения наблюдений распределены по нормальному закону со средним значением 150000 руб. и среднеквадратическим отклонением 20000 руб. Тогда в соответствии с правилом 3-х сигм продажи ниже, чем 150 000 - 20 000 x 3 = 90 000, и выше, чем 150 000 + 20 000 х 3 = 210 000, являются практически невозможными событиями. Фактически это означает, что рассматривать данные объемы продаж как потенциально возможные не имеет смысла.
{% endhint %}


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://sultanlive.gitbook.io/shad-ml/osnovy-statistiki-chast-1/normalnoe-raspredelenie.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
