Центральна гранична теорема

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

Центральна гранична теорема — теорема теорії ймовірностей про збіжність розподілу суми незалежних однаково розподілених випадкових величин до нормального розподілу. Ця теорема підкреслює особливість нормального розподілу в теорії ймовірностей.

Наприклад, отримано вибірку, яка містить велику кількість спостережень, кожне з яких було отримано випадковим чином і вони не залежать від інших спостережень, і на основі значень цих спостережень розраховують арифметичне середнє. Якщо цю процедуру повторити багато разів, центральна гранична теорема стверджує, що розраховані середні значення будуть мати нормальний розподіл. Простим прикладом цього є багаторазове підкидання монети при яких імовірність випадіння заданої кількості гербів у всій послідовності подій буде наближатися до нормальної кривої, із середнім, що знаходитиметься по середині від загальної кількості випадань монети на кожну сторону. (Граничне значення для нескінченної кількості підкидань буде дорівнювати нормальному розподілу.)

Центральна гранична теорема має декілька варіантів. У своїй загальній формі, випадкові величини повинні бути однаково розподілені. У деяких варіантах, збіжність середнього значення прямує до нормального розподілу також і у випадку не однаково розподілених величин, або не лише при незалежних спостереженнях, що буде здійснюватися за умови виконання певних умов.

У перших версіях цієї теореми, нормальний розподіл може використовуватися як апроксимація біноміального розподілу, що відомо як локальна теорема Муавра — Лапласа.

Центральна гранична теорема для незалежних послідовностей

Незалежно від форми розподілу сукупності, розподіл послідовної вибірки прямує до Гаусового розподілу, і його дисперсія визначається центральною граничною теоремою.[1]

Класичне формулювання

Нехай {Xk} — послідовність взаємно незалежних випадкових величин з однаковими розподілами, які мають скінченне математичне сподівання μ=E(Xk) та скінченну дисперсію σ2=D(Xk).

Нехай Sn=X1++Xn. Тоді

n(Snnμ) n N(0,σ2).

А для довільних фіксованих α,β (α<β) справедливо:

P{α<Snnμσn1/2<β}Φ(β)Φ(α).

Де Φ(x) — нормальна функція розподілу[2][3].

Формулювання Ляпунова

Теорема названа на честь російського математика Олександра Ляпунова. У цьому варіанті центральної граничної теореми випадкові величини Xi мають бути незалежними, але не обов'язково однаково розподіленими. Теорема також вимагає щоб випадкові величини |Xi| мали скінченні моменти деякого порядку Шаблон:Nowrap і швидкість зростання цих моментів має бути обмежена умовою Ляпунова.

ЦГТ Ляпунова[4]: Нехай {Xi} — послідовність незалежних випадкових величин, таких, що кожна з них має скінченне математичне сподівання μi і дисперсію σi2. Позначимо sn2=i=1nσi2. Якщо для деякого δ>0 виконується умова Ляпунова

limn1sn2+δi=1nE[|Xiμi|2+δ]=0

Тоді сума Zn=Xiμisn прямує за розподілом до стандартного нормального розподілу, при n

1sni=1n(Xiμi) d 𝒩(0,1).

На практиці зазвичай найлегше перевірити умову Ляпунова для δ=1. Якщо послідовність випадкових величин задовольняє умову Ляпунова, то вона задовольняє також умову Лінденберга. Зворотне твердження не правильне.

Формулювання Ліндеберга

Шаблон:Main Використовуючи ті позначення що й у попередньому параграфі, замінюючи умову Ляпунова на слабшу (запропоновану фінським математиком Ліндебергом у 1920 році) можна отримати нове формулювання центральної граничної теореми.

Якщо для кожного ε>0 виконується
limn1sn2i=1nE[(Xiμi)2𝟏{|Xiμi|>εsn}]=0
де 1{}характеристична функція. Тоді розподіл стандартизованої суми Zn прямує до стандартного нормального розподілу N(0,1).

Багатовимірна ЦГТ

Доведемо, що характеристичні функції можна розширити до випадку, коли кожна окрема величина Шаблон:Math є випадковим вектором у Шаблон:Math, із вектором середніх значень Шаблон:Math і матрицею коваріацій Шаблон:Math (між компонентами вектора), і ці випадкові вектори є незалежними і однаково розподіленими. Сумування цих векторів виконується поелементно. Багатовимірна центральна гранична теорема стверджує, що при масштабуванні, суми збігаються до багатовимірного нормального розподілу.[5]

Припустимо, що

𝐗i=[Xi(1)Xi(k)]

це Шаблон:Mvar-вимірний вектор. Виділення жирним шрифтом для Шаблон:Math означає, що це випадковий вектор, а не випадкова (одновимірна) величина. Тоді сума випадкових векторів дорівнюватиме

[X1(1)X1(k)]+[X2(1)X2(k)]++[Xn(1)Xn(k)]=[i=1n[Xi(1)]i=1n[Xi(k)]]=i=1n𝐗i

а середнє дорівнюватиме

1ni=1n𝐗i=1n[i=1nXi(1)i=1nXi(k)]=[X¯i(1)X¯i(k)]=𝐗¯𝐧

і таким чином

1ni=1n[𝐗iE(Xi)]=1ni=1n(𝐗iμ)=n(𝐗nμ).

Багатовимірна центральна гранична теорема стверджує, що

n(𝐗nμ) D Nk(0,Σ)

де коваріаційна матриця Шаблон:Math дорівнює

Σ=[Var(X1(1))Cov(X1(1),X1(2))Cov(X1(1),X1(3))Cov(X1(1),X1(k))Cov(X1(2),X1(1))Var(X1(2))Cov(X1(2),X1(3))Cov(X1(2),X1(k))Cov(X1(3),X1(1))Cov(X1(3),X1(2))Var(X1(3))Cov(X1(3),X1(k))Cov(X1(k),X1(1))Cov(X1(k),X1(2))Cov(X1(k),X1(3))Var(X1(k))].

А швидкість збіжності задається наступним результатом Шаблон:Нп:

Теорема.[6] Нехай

X1,,Xn

незалежні випадкові вектори із області значень

Rd

, кожний з яких має нульове середнє. Запишемо

S=i=1nXi

і припустимо

Σ=Cov[S]

є зворотньою. Нехай

ZN(0,Σ)

буде

d

-вимірним Гаусовим розподілом із тим самим середнім і коваріаційною матрицею як у

S

. Тоді для всіх опуклих множин

URd

,

|Pr[SU]Pr[ZU]|Cd1/4γ,

де C це універсальна стала, γ=i=1nE[Σ1/2Xi23], і 2 позначає Евклідову норму для Rd.

Не відомо чи множник d1/4 є необхідним.[7]


Узагальнена теорема

Центральна гранична теорема стверджує, що сума деякої кількості незалежних і однаково розподілених випадкових величин із скінченною дисперсією буде прямувати до нормального розподілу із збільшенням кількості цих величин. Узагальнена її версія, яку запропонували Гнєденко і Колмогоров стверджує, що сума деякої кількості випадкових величин із розподілами, що мають хвіст, який відповідає степеневому закону (Хвіст розподілу Парето), зменшується як |x|Шаблон:Math де Шаблон:Math (і таким чином має нескінченну дисперсію) буде прямувати до стійкого розподілу Шаблон:Math із тим як кількість елементів суми збільшується.[8][9] Якщо Шаблон:Math, тоді сума збігається до стійкого розподілу із параметром стабільності який дорівнює 2, тобто Гауссового розподілу.[10]

Доведення класичної ЦГТ

Центральна гранична теорема має просте доведення за допомогою характеристичних функцій.[11] Воно подібне до доведення (слабкого) закону великих чисел.

Припустимо Шаблон:Math} є незалежними і однаково розподіленими випадковими величинами, кожна з яких має середнє Шаблон:Mvar і скінченну дисперсію Шаблон:Math. Сума Шаблон:Math має середнє Шаблон:Mvar і дисперсію Шаблон:Math. Розглянемо випадкову величину

Zn = X1++Xnnμnσ2 = i=1nXiμnσ2 = i=1n1nYi,

де в останньому кроці ми визначили нові випадкові величини Шаблон:Math, кожна з яких має нульове середнє і одиничну дисперсію (Шаблон:Math). Характеристична функція для Шаблон:Mvar має вигляд

φZn(t) = φi=1n1nYi(t) = φY1(tn)φY2(tn)φYn(tn) = [φY1(tn)]n,

Де в останньому кроці ми застосували факт, що всі Шаблон:Mvar однаково розподілені. Відповідно до теореми Тейлора характеристична функція для Шаблон:Math матиме вигляд,

φY1(tn) = 1t22n+o(t2n),(tn)0

де Шаблон:Math є "[[Нотація_Ландау|нотацією маленького Шаблон:Mvar]]" для деякої функції від Шаблон:Mvar, яка прямує до нуля набагато швидше ніж Шаблон:Math. Відповідно до границі показникової функції (Шаблон:Math), характеристична функція для Шаблон:Mvar дорівнює

φZn(t)=(1t22n+o(t2n))ne12t2,n.

Зауважимо, що всі терми старшого порядку в даному виразі зникають при границі де Шаблон:Math. Права сторона виразу дорівнює характеристичній функції стандартного нормального розподілу Шаблон:Math, із чого разом із Шаблон:Нп випливає, що розподіл Шаблон:Mvar буде наближатися до Шаблон:Math з тим як Шаблон:Math. Таким чином, сума Шаблон:Math буде наближатися до нормального розподілу Шаблон:Math, і значення вибіркового середнього

Sn=X1++Xnn

збігається до нормального розподілу Шаблон:Math, з чого випливає центральна гранична теорема.

Застосування і приклади

Простий приклад

Малюнок ілюструє центральну граничну теорему. Вибіркові середні генеруються за допомогою генератора випадкових чисел, який видає числа у діапазоні значень від 0 до 100, що мають рівномірний розподіл імовірностей. Він показує, що при збільшенні розмірів вибірки результатів до 500 виміряних вибіркових середніх отримане середнє значення стає ближчим до середнього значення сукупності (50 в даному випадку). На малюнку також порівнюються розподіли що спостерігаються із розподілами, які були б очікувані для нормалізованого розподілу Гаусса, і показує значення критерію Хі-квадрат, які дають якісну оцінку збігу (збіг буде добрим якщо значення Хі-квадрат є меншим або близьким до одиниці). Входом до нормалізованої функції Гаусса є середнє значення вибіркових середніх (~50) і стандартне відхилення вибіркового середнього розділене на квадратний корінь від розміру вибірки (~28.87/Шаблон:Math), що називається стандартним відхиленням середнього (оскільки воно означає розмах значень вибіркового середнього).

Простим прикладом центральної граничною теореми є підкидання великої кількості ідентичних гральних кісток. Розподіл суми (або середнього) від тих чисел що випадуть буде добре апроксимуватися за допомогою нормального розподілу. Оскільки величини реального світу часто є збалансованою сумою багатьох неспостережувальних випадкових подій, центральна гранична теорема також частково пояснює те, що нормальний розподіл зустрічається досить часто. Вона також виправдовує застосування апроксимації для великих статистичних вибірок до нормального розподілу у контрольованих експериментах.

Порівняння функцій густини імовірностей, Шаблон:Math для суми із Шаблон:Mvar справжніх 6-граних гральних кісток, що показує їх наближення до нормального розподілу при збільшенні Шаблон:Mvar, що відповідає центральній граничній теоремі. У нижньому-правому графіку, згладжені профілі попередніх графіків масштабовано, накладено поверх і порівняно із нормальним розподілом (чорна крива).
Інша симуляція із використанням біноміального розподілу. Було згенеровано випадкові 0-і та 1-і, а потім їх середнє розраховано для різних розмірів вибірки від 1 до 512. Можна помітити, як із збільшенням розміру вибірки хвости стають тоншими, а розподілення значень все більше концентруються довкола середнього.

Типові застосування з реального життя

У літературі можна знайти велику кількість корисних і цікавих прикладів застосувань, пов'язаних із центральною граничною теоремою.[12] Одним із таких прикладів[13] є наступні ситуації:

  • Розподіл імовірності загальної пройденої відстані у випадковому блуканні (зміщеної або незміщеної) буде прямувати до нормального розподілу.
  • Підкидання великої кількості монет буде мати нормальний розподіл для загальної кількості випадання аверсів (або реверсів).

З іншої точки зору, центральна гранична теорема пояснює common appearance "дзвоноподібної кривої" при оцінках функції густини застосованих до даних реального світу. В таких випадках як електричний шум, екзаменаційні оцінки, і так далі, ми часто можемо розглядати одне конкретне вимірюване значення як зважене середнє великої кількості малих випадкових впливів. Використавши узагальнення центральної граничної теореми, ми можемо побачити, що дуже часто (хоча не завжди) це утворюватиме в результаті розподіл, що наближений до нормального.

В загальному розумінні, чим більше вимірювання є подібним до суми випадкових величин із однаковим впливом на результат, тим ближче воно буде до нормального розподілу. Це обґрунтовує поширене використання цього розподілу як такого, що відповідає впливам неспостережувальних змінних у моделях, таких як лінійні моделі.

Див. також

Шаблон:Портал

Джерела

Примітки

Шаблон:Reflist

Шаблон:Math-stub