Нормальний розподіл

Матеріал з testwiki
Версія від 14:43, 27 жовтня 2024, створена imported>Olexa Riznyk (+інформація за Фішером)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Шаблон:Розподіл ймовірностей Нормальний розподіл (розподіл Ґауса) — розподіл ймовірностей випадкової величини, що характеризується густиною ймовірності

f(x;μ,σ)=1σ2πexp((xμ)22σ2)

де μ — математичне сподівання, σ2 — дисперсія випадкової величини. Параметр σ також відомий, як стандартне відхилення. Розподіл із μ=0 та σ2=1 називають стандартним нормальним розподілом.

Центральна гранична теорема стверджує, що нормальний розподіл виникає тоді, коли дана випадкова величина являє собою суму великого числа незалежних випадкових величин, кожна з яких відіграє незначну роль в утворенні всієї суми. Наприклад, відстань від влучення снаряду гармати до цілі при великій кількості пострілів характеризується саме нормальним розподілом.

Нормально розподілена випадкова величина позначається так: ξN(μ,σ2).

Визначення

Стандартний нормальний розподіл

Найпростіший варіант нормального розподілу відомий як стандартний нормальний розподіл. Це особливий випадок, коли μ=0 і σ=1, і його описують такою функцією густини імовірності:

φ(x)=12πe12x2

Коефіцієнт 1/2π в даному виразі гарантує, що загальна площа під кривою φ(x) дорівнює одиниці.[1] Множник 1/2 в показнику експоненти гарантує, що розподіл має одиничну дисперсію (тобто дисперсія дорівнює одиниці), а таким чином і одиничне стандартне відхилення. Ця функція симетрична довкола значення x=0, де вона набуває свого максимального значення 1/2π і має дві точки перегину при x=+1 і x=1.

В деяких авторів можуть бути відмінності щодо того який нормальний розподіл вважати "стандартним". Гаусс визначив стандартний нормальний розподіл як такий, що має дисперсію σ2=1/2, і має функцію густини імовірності:

φ(x)=ex2π

Шаблон:Нп[2] пішов навіть далі, коли визначив стандартний нормальний розподіл із дисперсією σ2=1/(2π) так:

φ(x)=eπx2

Загальний нормальний розподіл

Кожний нормальний розподіл є різновидом стандартного нормального розподілу, область значень якого була розтягнута на величину σ (стандартне відхилення) і потім переміщена на μ (середнє значення):

f(xμ,σ2)=1σφ(xμσ).

Густина імовірності повинна масштабуватися на 1/σ так щоб інтеграл зберігав значення 1.

Нехай Z це Шаблон:Нп, тоді X=σZ+μ матиме нормальний розподіл із сподіванням μ і стандартним відхиленням σ. І навпаки, якщо X є нормальним відхиленням із параметрами μ і σ2, тоді Z=(Xμ)/σ матиме стандартний нормальний розподіл. Цей варіант називається стандартизованою формою X

Кожен нормальний розподіл є експонентою квадратичної функції:

f(x)=eax2+bx+c

де a<0 і c=b2/(4a)+ln(a/π)/2. В даній формі, середнє значення дорівнює μ=b/(2a), а дисперсія дорівнює σ2=1/(2a). У випадку стандартного нормального розподілу, a=1/2, b=0, а c=ln(2π)/2.

Позначення

Густина імовірності стандартного Гауссового розподілу (стандартного нормального розподілу) (із нульовим середнім і одиничною дисперсією) часто позначається грецькою літерою ϕ (Фі).[3] Також часто використовується інша форма літери фі — φ.

Нормальний розподіл позначають як N(μ,σ2) або 𝒩(μ,σ2).[4] Таким чином, якщо випадкова величина X має нормальний розподіл із середнім μ і дисперсією σ2, це можна записати наступним чином

X𝒩(μ,σ2).

Альтернативні параметризації

Деякі автори виступають за використання параметру τ як такий, що визначає ширину розподілу, замість відхилення σ або дисперсії σ2. Цей параметр як правило визначається як обернена дисперсія, 1/σ2.[5] Формула розподілу тоді приймає наступний вигляд:

f(x)=τ2πeτ(xμ)2/2.

Цей варіант, як стверджують, має переваги при виконанні чисельних розрахунків коли σ має значення дуже близьке до нуля і в деяких контекстах спрощує формули, наприклад, у Баєсовій статистиці випадкових величин із багатовимірним нормальним розподілом.

Також коефіцієнт може визначатися як обернене відхилення τ=1/σ, тоді вираз нормального розподілу стане наступним:

f(x)=τ2πe(τ)2(xμ)2/2.

На думку Стінглера, таке формулювання має переваги у швидкому запам'ятовуванні формули, і дозволяє мати просте наближення формул для квантилів розподілу.

Особливість

Якщо випадкові величини X,Y мають нормальний розподіл імовірностей, то їх сума Z=X+Y,  різниця V=XY також будуть нормально розподілені, а добуток U=XY величин X,Y не буде підпорядкований нормальному розподілу. [6]

Властивості

Нормальний розподіл із функцією густини f(x) (математичним сподіванням μ і стандартним відхиленням σ>0) має наступні властивості:

Крім того, густина φ стандартного нормального відхилення (тобто, з μ=0 і σ=1) має також наступні властивості:

  • Її перша похідна дорівнює φ(x)=xφ(x).
  • Її друга похідна дорівнює φ(x)=(x21)φ(x).
  • В загальному випадку, її Шаблон:Mvar-та похідна дорівнює φ(n)(x)=(1)nHen(x)φ(x), де Hen(x) є Шаблон:Mvar-им (імовірнісний) поліномом Ерміта.[9]
  • Ймовірність того, що нормально розподілена випадкова величина X із відомими μ і σ знаходиться в певному проміжку, можна розрахувати із відомого факту, що частка Z=(Xμ)/σ має стандартний нормальний розподіл.

Лог-нормальний розподіл

Функція розподілу F(y), в якій логарифм величини є нормально розподіленим:

F(y)=fgauss(lny),

де fgauss(x) — функція розподілу Гауса.

Такою функцією описується розподіл частинок аерозолю за розмірами.[10]

Кумулятивна функція розподілу ймовірностей

Кумулятивна функція розподілу ймовірностей стандартного нормального розподілу, зазвичай позначають великою грецькою літерою Φ (фі), є наступним інтегралом

Φ(x)=12πxet2/2dt

В статистиці часто застосовують споріднену функції помилок, або erf(x), що визначена як імовірність випадкової величини із нормальним розподілом, що має нульове середнє і дисперсію 1/2 потрапити у проміжок значень [x,x]; що записується наступним чином

erf(x)=2π0xet2dt

Ці інтеграли не можливо виразити за допомогою елементарних функцій, що часто називають спеціальними функціями. Однак існує багато відомих чисельних апроксимацій; див. below.

Ці дві функції тісно пов'язані одна з одною, а саме:

Φ(x)=12[1+erf(x2)]

Для випадку загального нормального розподілу із густиною f, середнім μ і відхиленням σ, кумулятивна функція розподілу буде наступною

F(x)=Φ(xμσ)=12[1+erf(xμσ2)]

Компоненту кумулятивної функції стандартного нормального розподілу, Q(x)=1Φ(x), часто називають Шаблон:Нп, особливо в технічній сфері.[11][12] Вона задає ймовірність того що значення стандартної нормальної випадкової величини X буде перевищувати значення x: P(X>x). Також іноді можуть використовуватися інші визначення Q-функції, усі пов'язані із простими перетвореннями Φ.[13]

Графік кумулятивної функції стандартного нормального розподілу Φ має 2-кратну обертову симетрію довкола точки (0,1/2); що задається як, Φ(x)=1Φ(x). її первісна (невизначений інтеграл) дорівнює

Φ(x)dx=xΦ(x)+φ(x)+C.

Кумулятивна функція розподілу ймовірностей стандартного нормального розподілу може розкладатися в ряд за допомогою інтегрування частинами:

Φ(x)=12+12πex2/2[x+x33+x535++x2n+1(2n+1)!!+]

де !! позначає Подвійний факторіал.

Центральна гранична теорема

Із збільшенням кількості дискретних подій, функція починає нагадувати нормальний розподіл
Порівняння функцій густини імовірності, p(k) для суми із n підкидувань 6-гранної гральної кістки, що показує їхню збіжність до нормального розподілу із збільшенням na, що відповідає центральній граничній теоремі. На графіку праворуч-внизу, показані масштабовані, накладені один на одного згладжені межі попередніх графіків і їх порівняння із нормальним розподілом (чорна крива).

Шаблон:Main article

Центральна гранична теорема стверджує, що при певних умовах, сума багатьох випадкових величин буде мати розподіл близький до нормального розподілу. Зокрема, якщо X1,,Xn — незалежні і однаково розподілені випадкові величини із однаковим розподілом, нульовим середнім, і дисперсією σ2 і з Z є їхнім середнім масштабованим на n

Z=n(1ni=1nXi)

Тоді, із збільшенням n, розподіл імовірностей величини Z буде збігатися із нормальним розподілом із нульовим середнім і дисперсією σ2.

Теорему можна поширити і для випадку коли величини (Xi) не є незалежними і/або не є однаково розподіленими, але тоді є умови на степені залежності і моменти розподілів.

Багато статистичних критеріїв, функцій внеску, і статистичних оцінок, що застосовуються на практиці містять в своїй основі суми певних випадкових величин, і навіть ще більшу кількість статистичних оцінок можна представити як суму випадкових величин використовуючи функції впливу. Центральна гранична теорема стверджує, що такі статистичні параметри будуть мати асимптотично нормальні розподіли.

Центральна гранична теорема також передбачає, що певні розподіли можливо апроксимувати за допомогою нормального розподілу, наприклад:

Наскільки достатньою є точність таких апроксимацій залежить від задачі, в якій вони застосовуються і швидкості збіжності до нормального розподілу. Як правило, такі апроксимації є менш точними на кінцях розподілу.

Загальна верхня межа похибки апроксимації для центральної граничної теореми задається Шаблон:Нп, поліпшення апроксимації досягається за допомогою Шаблон:Нп.

Див. також

Джерела

Шаблон:Портал

Примітки

Шаблон:Reflist

Шаблон:Statistics-stub Шаблон:Список розподілів ймовірності

  1. За доведенням цього див. Гауссів інтеграл
  2. Шаблон:Harvtxt
  3. Шаблон:Harvtxt
  4. Шаблон:Harvtxt
  5. Шаблон:Harvtxt
  6. Пряха Б. Означення суми, різниці та добутку випадкових величин Шаблон:Webarchive // Геодезія, картографія і аерофотознімання: Міжвідомчий науково-технічний збірник. — Л. : Видавництво Національного університету «Львівська політехніка». — 2009. — Вип. 72. — С. 41—49.
  7. 7,0 7,1 7,2 Шаблон:Harvtxt
  8. Шаблон:Harvtxt
  9. Шаблон:Harvtxt
  10. Глосарій термінів з хімії // Й. Опейда, О. Швайка. Ін-т фізико-органічної хімії та вуглехімії ім. Л. М. Литвиненка НАН України, Донецький національний університет. — Донецьк : Вебер, 2008. — 758 с. — ISBN 978-966-335-206-0
  11. Шаблон:Cite web
  12. Шаблон:Cite web
  13. Шаблон:MathWorld
  14. Шаблон:Cite web