Стандартному нормальному закону распределения

Содержание статьи:

Нормальное распределение

Материал из MachineLearning.

Нормальное распределение, также называемое распределением Гаусса, — распределение вероятностей, которое играет важнейшую роль во многих областях знаний, особенно в физике. Физическая величина подчиняется нормальному распределению, когда она подвержена влиянию огромного числа случайных помех. Ясно, что такая ситуация крайне распространена, поэтому можно сказать, что из всех распределений в природе чаще всего встречается именно нормальное распределение — отсюда и произошло одно из его названий.

Нормальное распределение зависит от двух параметров — смещения и масштаба, то есть является с математической точки зрения не одним распределением, а целым их семейством. Значения параметров соответствуют значениям среднего (математического ожидания) и разброса (стандартного отклонения).

Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием 0 и стандартным отклонением 1.

Содержание

Моделирование нормальных случайных величин

Простейшие, но неточные методы моделирования основываются на центральной предельной теореме. Именно, если сложить много независимых одинаково распределённых величин с конечной дисперсией, то сумма будет распределена примерно нормально. Например, если сложить 12 независимых базовых случайных величин, получится грубое приближение стандартного нормального распределения. Тем не менее, с увеличением слагаемых распределение суммы стремится к нормальному.

Использование точных методов предпочтительно, поскольку у них практически нет недостатков. В частности, преобразование Бокса — Мюллера является точным, быстрым и простым для реализации методом генерации.

Если случайные величины и независимы и имеют нормальное распределение с математическими ожиданиями и и дисперсиями и соответственно, то также имеет нормальное распределение с математическим ожиданием и дисперсией .

Статистическая проверка принадлежности нормальному распределению

Поскольку нормальное распределение часто встречается на практике, то для него разработаны специальные статистические критерии проверки на «нормальность»:

Многомерное нормальное распределение

Многоме́рное норма́льное распределе́ние (или многоме́рное га́уссовское распределе́ние) в теории вероятностей — это обобщение одномерного нормального распределения.

Случайный вектор имеет многомерное нормальное распределение, если выполняется одно из следующих эквивалентных условий:

  • Произвольная линейная комбинация компонентов вектора имеет нормальное распределение или является константой.
  • Существует вектор независимых стандартных нормальных случайных величин , вещественный вектор и матрица размерности , такие что:

.

  • Существует вектор и неотрицательно определённая симметричная матрица размерности , такие что плотность вероятности вектора имеет вид:

,

где — определитель матрицы , а — матрица обратная к .

  • Существует вектор и неотрицательно определённая симметричная матрица размерности , такие что характеристическая функция вектора имеет вид:

.

  • Если одно из приведённых выше определений принято в качестве основного, то другие выводятся в качестве теорем.
  • Вектор является вектором средних значений , а — его ковариационная матрица.
  • В случае , многомерное нормальное распределение сводится к обычному нормальному распределению.
  • Если случайный вектор имеет многомерное нормальное распределение, то пишут .

Свойства многомерного нормального распределения

  • Если вектор имеет многомерное нормальное распределение, то его компоненты имеют одномерное нормальное распределение. Обратное, вообще говоря, неверно!
  • Если случайные величины имеют одномерное нормальное распределение и совместно независимы, то случайный вектор имеет многомерное нормальное распределение. Матрица ковариаций такого вектора диагональна.
  • Если имеет многомерное нормальное распределение, и его компоненты попарно некоррелированы, то они независимы. Однако, если только компоненты имеют одномерное нормальное распределение и попарно не коррелируют, то отсюда не следует, что они независимы.

Контрпример. Пусть , а с равными вероятностями. Тогда если , то корреляция и равна нулю. Однако, эти случайные величины зависимы.

  • Многомерное нормальное распределение устойчиво относительно линейных преобразований. Если , а — произвольная матрица размерности , то

.

Заключение

Нормальное распределение наиболее часто встречается в природе, нормально распределёнными являются следующие случайные величины:

  • отклонение при стрельбе
  • ошибки при измерениях
  • рост человека

Такое широкое распространение закона связано с тем, что он является предельным законом, к которому приближаются многие другие (например, биномиальный). Доказано, что сумма очень большого числа случайных величин, влияние каждой из которых близко к 0, имеет распределение, близкое к нормальному. Этот факт является содержанием предельной теоремы Ляпунова.

Нормальное распределение

Нормальное распределение, также называемое распределением Гаусса, — распределение вероятностей, которое играет важнейшую роль во многих областях знаний, особенно в физике. Физическая величина подчиняется нормальному распределению, когда она подвержена влиянию огромного числа случайных помех. Ясно, что такая ситуация крайне распространена, поэтому можно сказать, что из всех распределений, в природе чаще всего встречается именно нормальное распределение — отсюда и произошло одно из его названий.

Нормальное распределение зависит от двух параметров — смещения и масштаба, то есть, является, с математической точки зрения, не одним распределением, а целым их семейством. Значения параметров соответствуют значениям среднего (математического ожидания) и разброса (стандартного отклонения).

Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием 0 и стандартным отклонением 1.

Содержание

Характеристики распределения Править

Плотность вероятности нормально распределённой случайной величины с параметром смещения $ \mu $ и масштаба $ \sigma $ (или, что тоже самое, дисперсией $ \sigma^2 $ ) имеет следующий вид:

Функция распределения такой величины не выражается через элементарные функции и записывается по определению через интеграл Римана как

Функция распределения стандартной нормальной случайной величины (т. е. при $ \mu = 0,\ \sigma = 1 $ ) часто обзначают как $ \operatorname <\Phi>(\cdot) $ :

$ \operatorname <\Phi>(x) = F (x; 0, 1) = \frac 1 <\sqrt <2 \pi>> \int _ <-\infty>^x \exp \left( -\frac 2 \right) dt. $

Функцию распределения нормальной случайной величины с любыми параметрами легко выразить через $ \operatorname <\Phi>(\cdot) $ :

$ F (x; \mu, \sigma) = \operatorname <\Phi>\left( \frac \sigma \right). $

Характеристическая функция нормального распределения имеет вид

$ f (t) = \operatorname \\> = \exp \left( i \mu t — \frac <\sigma^2 t^2>2 \right), $

где $ \xi \sim N (\mu, \sigma^2) $ — нормально распредёленная с параметрами $ \mu $ и $ \sigma $ случайная величина.

$ M (t) = \operatorname \\> = \exp \left( \mu t + \frac <\sigma^2 t^2>2 \right). $

Процентили стандартного нормального распределения Править

Процентили стандартного нормального распределения задаются уравнением

$ \Phi(z_<\alpha>) = \alpha, \quad \alpha \in [0,1] $ .

Ниже суммированы значения процентилей для наиболее чaсто встречающихся значений $ \alpha $ .

Моделирование нормальных случайных величин Править

Неточные методы моделирования основываются на центральной предельной теореме. Именно, если сложить много независимых одинаково распределённых величин с конечной дисперсией, то сумма будет распределена примерно нормально. Например, если сложить 12 независимых базовых случайных величин, получится грубое приближение стандартного нормального распределения.

Тем не менее, использование точных методов предпочтительно, поскольку у них практически нет недостатков. В частности, преобразование Бокса — Мюллера является точным, быстрым и простым для реализации методом генерации.

Статистическая проверка принадлежности нормальному распределению Править

Поскольку нормальное распределение часто встречается на практике, то для него разработаны специальные статистические критерии: критерий Пирсона, критерий Колмогорова — Смирнова и др.

Курьёзы с нормальным распределением Править

В популярных психологических тестах часто используются списки вопросов, ответы на которые соответствуют определённым количествам баллов, которые затем суммируются. В зависимости от суммы, испытуемого причисляют к той или иной категории. Оказывается, что согласно центральной предельной теореме, если вопросы не имеют никакого смысла и никак не соотносятся с теми категориями, к которым причисляют испытуемых, а ответы случайны (то есть, если тест фальшивый), то распределение сумм окажется приближенно нормальным, а это значит, что большинство испытуемых окажутся причислены к некоей средней категории.

Поэтому, если в каком-то тесте вы (да ещё и ваши знакомые) оказались посередине шкалы, знайте, что это, вполне возможно, сработало нормальное распределение, а тест ничего не значит.

Стандартное нормальное распределение

Здравствуйте, уважаемые любители статистики. Продолжаем разговор о нормальном распределении случайной величины. Напомню, что не только нормальное, но и любое другое теоретические распределение является своеобразным эталоном частот появления различных значений. В случае близкой схожести эмпирического и теоретического распределений, к первым можно применить свойства вторых. Это позволит по реальным данным получать ответы на такие вопросы как: каковы шансы попасть в тот или иной интервал, какова вероятность, что в результате эксперимента случайная величина окажется больше (меньше) заданного уровня и т.д. и т.п.

Как же выглядит эталонное нормальное распределение, если даже в теории оно зависит от двух параметров (математического ожидания и дисперсии)? Понятно, что при анализе выборки есть только оценки этих параметров (средняя арифметическая и выборочная дисперсия), но это не отменяет того факта, что нормальное распределение обладает некоторым масштабом, характерным для конкретных данных. Эталон же должен быть универсальным и не зависеть от масштаба и единиц измерения. И он, конечно же, существует. Называется стандартным нормальным распределением. От обычного отличается тем, что его математическое ожидание всегда равно 0, а дисперсия – 1, кратко N(0, 1).

Для того, чтобы воспользоваться теоретическими вероятностями, масштаб реальных данных нужно «подогнать» под эталон. Делается это довольно просто с помощью процедуры нормирования:

где z – новая переменная, которая используется вместо x;
m – математическое ожидание;
σ – среднеквадратическое отклонение.

При анализе выборки берутся оценки:

Среднее арифметическое и дисперсия новой переменной z теперь также равны 0 и 1 соответственно. В этом легко убедиться с помощью элементарных алгебраических преобразований.

В литературе встречается название z-оценка. Это оно самое – нормированные данные. Z-оценку можно напрямую сравнивать с теоретическими вероятностями, т.к. ее масштаб совпадает с эталоном.

Посмотрим теперь, как выглядит плотность стандартного нормального распределения (для z-оценок). Напомню, что функция Гаусса имеет вид:

Подставим вместо (x-m)/σ букву z, а вместо σ – единицу, получим функцию плотности стандартного нормального распределения:

Соответствующий рисунок ниже:

Центр, как и ожидалось, находится в точке 0. В этой же точке функция Гаусса достигает своего максимума, что соответствует принятию случайной величиной своего среднего значения (т.е. x-m=0). Плотность в этой точке равна 0,3989, что можно посчитать даже в уме, т.к. e 0 =1 и остается рассчитать только соотношение 1 на корень из 2 пи.

Таким образом, по графику хорошо видно, что значения, имеющие маленькие отклонения от средней, выпадают чаще других, а те, которые сильно отдалены от центра, встречаются значительно реже. Шкала оси абсцисс измеряется в средних квадратичных отклонениях, что позволяет отвязаться от единиц измерения и получить универсальную структуру нормального распределения. Кривая Гаусса для нормированных данных отлично демонстрирует и другие свойства нормального распределения. Например, то, что оно является симметричным относительно оси ординат. Все это здорово облегчает подсчет нужных вероятностей. Так, в пределах ±1σ от средней арифметической сконцентрирована большая часть всех значений (прикидываем пока на глазок). В пределах ±2σ находятся почти все значения, а за ±3σ вообще мало что выпадает. Такое распределение вероятностей лежит в основе многих статистических методов, в частности, в проверке статистических гипотез.

Сразу стоит отметить, что формула нормирования, приводящая к масштабу N(0, 1) вносит коррективы в интерпретацию случайной величины. Теперь случайное значение – это не просто наблюдаемая величина (размер чего-нибудь, например), а отклонение от средней арифметической, измеряемое в среднеквадратических отклонениях. Поэтому вопросы относительно вероятностей имеют следующую формулировку. Например, какова вероятность того, что случайная величина z отклонится от средней (которая 0) не более, чем на 2 (среднеквадратических отклонения). И если данные действительно имеют подобное распределение, то ответ на этот вопрос всегда одинаков – 95,45%. То бишь в пределах ±2 сигмы от средней арифметической находится 95% всей совокупности нормально распределенных данных. Отсюда следует простой вывод, что вероятность отклонения за эти пределы относительно маленькая, всего 5%. Или наоборот – целых 5%. Все зависит от поставленной задачи.

Процент попадания в интервал, измеряемый в сигмах, очевидно, больше не зависит от масштаба данных, что позволяет строить стандартные вероятностные модели для статистических выводов и принятия решений. К примеру, после проведения социологического опроса на предмет рейтинга кандидатов в президенты можно довольно уверенно заявить, что ошибка полученного рейтинга с вероятностью 95% составит не более, чем ± некоторая величина, соответствующая 2-м стандартным отклонениям. Ну и 5% на то, что реальный рейтинг превысит указанную погрешность.

Рассмотрим теперь функцию стандартного нормального распределения, т.к. именно она позволяет рассчитывать интересующие вероятности. Для этого, напоминаю, нужно взять интеграл:

Подставляя в это уравнение интересующие значения z, можно рассчитать вероятность того, что нормально распределенная случайная величина окажется менее этого z. Другие интервалы можно легко получить, используя свойство непрерывного распределения.

Обычная функция нормального распределения с параметрами m и σ и функция стандартного нормального распределения удовлетворяют равенству:

Поэтому имея только реальные данные довольно легко перейти вначале к z-оценкам, а затем уже к вычислению интересующих вероятностей с помощью функции N(0, 1).

Прежде, чем перейти к графику функции распределения, предлагаю еще раз посмотреть, как на графике плотности изображается вероятность. Она соответствует площади левого «хвоста» под плотностью распределения:

Например, для z=0 значение функции нормального распределения равно 0,5 (половина от всей площади). На словах это значит, что вероятность принятия случайной величиной значения больше или меньше математического ожидания одинакова. Оно и не удивительно, т.к. плотность симметрична в правую и левую сторону от оси ординат. Это же значение легко увидеть на графике функции стандартного нормального распределения – оно делит функцию пополам в отметке 0,5 по оси ординат (максимальное значение любой функции распределения равно 1):

Понятно, что вероятности могут быть самыми разными от 0 до 1. И визуально провести расчет, как мы это сделали для z=0 не получится. Для точного определения вероятностей (значения функции стандартного нормального распределения) придется уже брать интеграл, что не такое уж и тривиальное дело. Одной арифметикой не обойтись.

Однако, чтобы простым гражданам не мучиться, умные люди все давно подсчитали и результаты занесли в специальные таблицы. Такие таблицы есть в любом учебнике по теории вероятностей или статистике. Получается, что никаких интегралов брать не нужно. Можно выдохнуть. Как пользоваться такими таблицами, обсудим в одной из ближайших статей. Иначе эта заметка будет слишком длинной.

Из данной статьи главное уяснить, что стандартное нормальное распределение – это нормальное распределение с параметрами 0 и 1 для матожидания и дисперсии соответственно. Оно нужно для того, чтобы закономерности нормального распределения привязать к универсальным единицам измерения случайной величины – среднеквадратическим (стандартным) отклонениям.

На сегодня все. Всех благ и до новых встреч.

Стандартному нормальному закону распределения

Для сокращенной записи того, что непрерывная случайная величина Х имеет нормированный (стандартный) нормальный закон распределения с параметрами m =0 и =1 , принято условное обозначение Х N (0,1).

График функции f 0 (х) называется нормированной нормальной кривой, кривой ошибок или просто стандартной кривой (рис.7).

Функция f 0 (х) и стандартная кривая имеют следующие свойства :

Область определения функции f 0 (х) — вся числовая ось (-  ; +  ).

Функция f 0 (х) может принимать только положительные значения: f 0 (х) 0, т.е. стандартная кривая расположена над осью 0 Х .

Ось 0 Х — горизонтальная асимптота стандартной кривой.

Стандартная кривая симметрична относительно прямой х=0 .

При х= m = 0 стандартная кривая имеет максимум:

Рис.7. Стандартная (нормированная) кривая (график плотности распределения вероятностей случайной величины, имеющей нормированное нормальное распределение)

Рис.8. График интегральной функции распределения вероятностей случайной величины, имеющей нормированное нормальное распределение

3.2. Интегральная функция распределения нормированной нормальной случайной величины:

3.3. Числовые характеристики нормированной нормальной случайной величины:

Mатематическое ожидание, мода и медиана совпадают и равны нулю:

3.4. Свойства нормированной нормальной случайной величины :

1) Вероятность попадания нормированной нормальной случайной величины Х в интервал (0;х) равна функции Лапласа (рис.7):

Геометрически функция Лапласа представляет собой заштрихованную площадь под стандартной кривой на отрезке (0; х ).

Интегральная функция распределения случайной величины, имеющей нормированное нормальное распределение, выражается через функцию Лапласа по формуле:

Геометрически (рис. 9) интегральная функция распределения представляет собой заштрихованную площадь под стандартной кривой на интервале (-  ; х ). Она состоит из двух частей: первой, на интервале (-  ; 0), равной 0,5, т.е. половине всей площади под стандартной кривой, и второй, на интервале (0; х ), равной функции Лапласа.

Рис. 9. Стандартная кривая с заштрихованной площадью, численно равной интегральной функции распределения F 0 (х)

3) Любую нормальную случайную величину можно преобразовать в нормированную:

если случайная величина Х имеет нормальный закон распределения с параметрами m и , то случайная величина имеет нормированное (стандартное) нормальное распределение с параметрами m=0 и =1.

ПРИМЕР 7 . Доказать, что если случайная величина Х имеет нормальный закон распределения с параметрами m и , то нормированная случайная величина имеет параметры распределения m =0 и σ =1.

Решение . Найдем математическое ожидание и дисперсию случайной величины Z :

При решении примера 7 использованы свойства математического ожидания и дисперсии, которые более подробно рассмотрены в методических указаниях [5]:

Математическое ожидание постоянной величины равно самой постоянной: М(С)=С.

Математическое ожидание суммы (разности) случайных величин равно сумме (разности) их математических ожиданий: М(ХУ)=М(Х)М(У).

Постоянный множитель можно выносить за знак математического ожидания: М(СХ)=СМ(Х).

Дисперсия постоянной величины равна нулю: D (С)=0.

Дисперсия суммы (разности) случайных величин равна сумме их дисперсий: D У)=D(Х) + D(У).

Постоянный множитель можно выносить за знак дисперсии, предварительно возведя его в квадрат: D (СХ)=С 2 D (Х).

Нормальное распределение

Строит график плотности вероятности и функции плотности распределения для нормального распределения.

Нормальное распределение — занимает особую роль в теории вероятностей. Это наиболее общее непрерывное распределение вероятностей, часто использующееся для представления случайных величин, закон распределения которых не известен.

Функция плотности вероятности

Плотность нормального распределения выражается функцией Гаусса:

где μ — математическое ожидание,
σ — среднеквадратическое отклонение,
σ ² — дисперсия,
медиана и мода нормального распределения равны математическому ожиданию μ.

Калькулятор ниже вычисляет значения функции плотности вероятности и функции распределения в заданной точке при для нормального распределения, определяемого заданной дисперсией и математическим ожиданием:

Нормальное распределение

Функция распределения

Функция распределения для нормального распределения задается формулой:

где, erf(x) — функция ошибок (Лапласа) или интеграл вероятности, определяемый как:

Квантильная функция

Квантильная функция нормального распределения выражается через обратную функцию ошибок:

p может принимать значения в диапазоне [0,1].

Квантильная функция стандартного нормального распределения (нормального распределения с σ =1, μ=0) упрощается до:
Эту функцию называют пробит функцией, применяется она в различных областях, для анализа зависимости качественных переменных от множества факторов.
Калькулятор ниже вычисляет значение квантильной функции нормального распределения ( можно задать дисперсию = 1 и мат ожидание=0, чтобы получить значение пробит функции).

Смотрите еще:

  • Возмездная опека приемная семья Пособия, выплаты и жилищные льготы ПРИЕМНЫЕ РОДИТЕЛИ: вознаграждение за выполнение родительских обязанностей, страховой стаж, подоходный налог, отпуск по уходу за ребенком, досрочная пенсия, дополнительные выплаты по уходу за […]
  • Штрафы гибдд в курской области Посмотреть штрафы гибдд курск 22.04.2014 | автор: T�x��_�o��� | Гаи пдд | Просмотров: 206 Быстрая загрузка: Посмотреть штрафы гибдд курск Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем […]
  • Закон о пенсиях в лнр 2018 О пенсионном обеспечении военнослужащих НМ ЛНР. Борис Рожин. [15.03.2018] В ЛНР приняли закон о пенсионном обеспечении бывших военнослужащих Народной Милиции Луганской Народной Республики. Воз сдвинулсяСовМин ЛНР приняли закон О […]
  • Прокурор г липецка Организация ПРОКУРАТУРА ЛИПЕЦКОЙ ОБЛАСТИ Адрес: Г ЛИПЕЦК,УЛ ЗЕГЕЛЯ, 25 Юридический адрес: 398002, Липецкая область, г Липецк, Советский округ, ул Зегеля, д 25 ОКФС: 12 - Федеральная собственность ОКОГУ: 1400040 - Система […]
  • Модели управления государственной собственностью Новая модель управления госимуществом ЮРИЙ МЕДВЕДЕВ первый заместитель министра имущественных отношений РФ Позади 10-летний период перехода России к рынку, и сегодня в стране налицо все черты рыночной экономики. Страна рассталась с […]
  • Нарушение правил парковки на стоянке Что грозит за нарушение правил парковки? Парковка (парковочное место) — специально обозначенное и при необходимости обустроенное и оборудованное место, являющееся в том числе частью автомобильной дороги и (или) примыкающее к проезжей […]
  • Приказ минэкономразвития 223 Приказ Министерства экономического развития РФ от 23 апреля 2012 г. N 223 "Об организации проведения конкурсного отбора субъектов Российской Федерации, бюджетам которых в 2012 году предоставляются субсидии для финансирования […]
  • Правила инъекций инсулина введение инсулина Цель: введение точной дозы инсулина для снижения уровня глюкозы в крови. Оснащение: флакончик с раствором инсулина, содержащий в 1 мл 40 ЕД (80 ЕД или 100 ЕД); спирт 70°; стерильные: лоток, пинцет; ватные шарики, […]