Центральна гранична теорема

Центральна гранична теорема — теорема теорії ймовірностей про збіжність розподілу суми незалежних однаково розподілених випадкових величин до нормального розподілу. Ця теорема підкреслює особливість нормального розподілу в теорії ймовірностей.

Наприклад, отримано вибірку, яка містить велику кількість спостережень, кожне з яких було отримано випадковим чином і вони не залежать від інших спостережень, і на основі значень цих спостережень розраховують арифметичне середнє. Якщо цю процедуру повторити багато разів, центральна гранична теорема стверджує, що розраховані середні значення будуть мати нормальний розподіл. Простим прикладом цього є багаторазове підкидання монети при яких імовірність випадіння заданої кількості гербів у всій послідовності подій буде наближатися до нормальної кривої, із середнім, що знаходитиметься по середині від загальної кількості випадань монети на кожну сторону. (Граничне значення для нескінченної кількості підкидань буде дорівнювати нормальному розподілу.)

Центральна гранична теорема має декілька варіантів. У своїй загальній формі, випадкові величини повинні бути однаково розподілені. У деяких варіантах, збіжність середнього значення прямує до нормального розподілу також і у випадку не однаково розподілених величин, або не лише при незалежних спостереженнях, що буде здійснюватися за умови виконання певних умов.

У перших версіях цієї теореми, нормальний розподіл може використовуватися як апроксимація біноміального розподілу, що відомо як локальна теорема Муавра — Лапласа.

Центральна гранична теорема для незалежних послідовностей

Незалежно від форми розподілу сукупності, розподіл послідовної вибірки прямує до Гаусового розподілу, і його дисперсія визначається центральною граничною теоремою.^[1]

Класичне формулювання

Нехай ${X_{k}}$ — послідовність взаємно незалежних випадкових величин з однаковими розподілами, які мають скінченне математичне сподівання $μ = E (X_{k})$ та скінченну дисперсію $σ^{2} = D (X_{k})$ .

Нехай $S_{n} = X_{1} + \dots + X_{n}$ . Тоді

\sqrt{n} (\frac{S_{n}}{n} - μ) \overset{n}{\to} N (0, σ^{2}) .

А для довільних фіксованих $α, β (α < β)$ справедливо:

P {α < \frac{S_{n} - n μ}{σ n^{1 / 2}} < β} \to Φ (β) - Φ (α) .

Де $Φ (x)$ — нормальна функція розподілу^[2]^[3].

Формулювання Ляпунова

Теорема названа на честь російського математика Олександра Ляпунова. У цьому варіанті центральної граничної теореми випадкові величини $X_{i}$ мають бути незалежними, але не обов'язково однаково розподіленими. Теорема також вимагає щоб випадкові величини $| X_{i} |$ мали скінченні моменти деякого порядку Шаблон:Nowrap і швидкість зростання цих моментів має бути обмежена умовою Ляпунова.

ЦГТ Ляпунова^[4]: Нехай {X_i} — послідовність незалежних випадкових величин, таких, що кожна з них має скінченне математичне сподівання $μ_{i}$ і дисперсію $σ_{i}^{2}$ . Позначимо $s_{n}^{2} = \sum_{i = 1}^{n} σ_{i}^{2}$ . Якщо для деякого $δ > 0$ виконується умова Ляпунова

\lim_{n \to \infty} \frac{1}{s_{n}^{2 + δ}} \sum_{i = 1}^{n} E [| X_{i} - μ_{i} |^{2 + δ}] = 0

Тоді сума $Z_{n} = \frac{X_{i} - μ_{i}}{s_{n}}$ прямує за розподілом до стандартного нормального розподілу, при $n \to \infty$

\frac{1}{s_{n}} \sum_{i = 1}^{n} (X_{i} - μ_{i}) \overset{d}{\to} 𝒩 (0, 1) .

На практиці зазвичай найлегше перевірити умову Ляпунова для $δ = 1$ . Якщо послідовність випадкових величин задовольняє умову Ляпунова, то вона задовольняє також умову Лінденберга. Зворотне твердження не правильне.

Формулювання Ліндеберга

Шаблон:Main Використовуючи ті позначення що й у попередньому параграфі, замінюючи умову Ляпунова на слабшу (запропоновану фінським математиком Ліндебергом у 1920 році) можна отримати нове формулювання центральної граничної теореми.

Якщо для кожного

ε > 0

виконується

\lim_{n \to \infty} \frac{1}{s_{n}^{2}} \sum_{i = 1}^{n} E [(X_{i} - μ_{i})^{2} \cdot 𝟏_{{| X_{i} - μ_{i} | > ε s_{n}}}] = 0

де

1_{{\dots}}

— характеристична функція. Тоді розподіл стандартизованої суми Z_n прямує до стандартного нормального розподілу N(0,1).

Багатовимірна ЦГТ

Доведемо, що характеристичні функції можна розширити до випадку, коли кожна окрема величина Шаблон:Math є випадковим вектором у Шаблон:Math, із вектором середніх значень Шаблон:Math і матрицею коваріацій Шаблон:Math (між компонентами вектора), і ці випадкові вектори є незалежними і однаково розподіленими. Сумування цих векторів виконується поелементно. Багатовимірна центральна гранична теорема стверджує, що при масштабуванні, суми збігаються до багатовимірного нормального розподілу.^[5]

Припустимо, що

𝐗_{i} = [\begin{matrix} X_{i (1)} \\ ⋮ \\ X_{i (k)} \end{matrix}]

це Шаблон:Mvar-вимірний вектор. Виділення жирним шрифтом для Шаблон:Math означає, що це випадковий вектор, а не випадкова (одновимірна) величина. Тоді сума випадкових векторів дорівнюватиме

[\begin{matrix} X_{1 (1)} \\ ⋮ \\ X_{1 (k)} \end{matrix}] + [\begin{matrix} X_{2 (1)} \\ ⋮ \\ X_{2 (k)} \end{matrix}] + \dots + [\begin{matrix} X_{n (1)} \\ ⋮ \\ X_{n (k)} \end{matrix}] = [\begin{matrix} \sum_{i = 1}^{n} [X_{i (1)}] \\ ⋮ \\ \sum_{i = 1}^{n} [X_{i (k)}] \end{matrix}] = \sum_{i = 1}^{n} 𝐗_{i}

а середнє дорівнюватиме

\frac{1}{n} \sum_{i = 1}^{n} 𝐗_{i} = \frac{1}{n} [\begin{matrix} \sum_{i = 1}^{n} X_{i (1)} \\ ⋮ \\ \sum_{i = 1}^{n} X_{i (k)} \end{matrix}] = [\begin{matrix} {\bar{X}}_{i (1)} \\ ⋮ \\ {\bar{X}}_{i (k)} \end{matrix}] = {\bar{𝐗}}_{𝐧}

і таким чином

\frac{1}{\sqrt{n}} \sum_{i = 1}^{n} [𝐗_{i} - E (X_{i})] = \frac{1}{\sqrt{n}} \sum_{i = 1}^{n} (𝐗_{i} - μ) = \sqrt{n} ({\overline{𝐗}}_{n} - μ) .

Багатовимірна центральна гранична теорема стверджує, що

\sqrt{n} ({\overline{𝐗}}_{n} - μ) \overset{D}{\to} N_{k} (0, Σ)

де коваріаційна матриця Шаблон:Math дорівнює

Σ = [\begin{matrix} Var (X_{1 (1)}) & Cov (X_{1 (1)}, X_{1 (2)}) & Cov (X_{1 (1)}, X_{1 (3)}) & \dots & Cov (X_{1 (1)}, X_{1 (k)}) \\ Cov (X_{1 (2)}, X_{1 (1)}) & Var (X_{1 (2)}) & Cov (X_{1 (2)}, X_{1 (3)}) & \dots & Cov (X_{1 (2)}, X_{1 (k)}) \\ Cov (X_{1 (3)}, X_{1 (1)}) & Cov (X_{1 (3)}, X_{1 (2)}) & Var (X_{1 (3)}) & \dots & Cov (X_{1 (3)}, X_{1 (k)}) \\ ⋮ & ⋮ & ⋮ & ⋱ & ⋮ \\ Cov (X_{1 (k)}, X_{1 (1)}) & Cov (X_{1 (k)}, X_{1 (2)}) & Cov (X_{1 (k)}, X_{1 (3)}) & \dots & Var (X_{1 (k)}) \end{matrix}] .

А швидкість збіжності задається наступним результатом Шаблон:Нп:

Теорема.^[6] Нехай
$X_{1}, \dots, X_{n}$
незалежні випадкові вектори із області значень
$R^{d}$
, кожний з яких має нульове середнє. Запишемо
$S = \sum_{i = 1}^{n} X_{i}$
і припустимо
$Σ = Cov [S]$
є зворотньою. Нехай
$Z \sim N (0, Σ)$
буде
$d$
-вимірним Гаусовим розподілом із тим самим середнім і коваріаційною матрицею як у
$S$
. Тоді для всіх опуклих множин
$U \subseteq R^{d}$
,
$| \Pr [S \in U] - \Pr [Z \in U] | \leq C d^{1 / 4} γ,$

де $C$ це універсальна стала, $γ = \sum_{i = 1}^{n} E [‖ Σ^{- 1 / 2} X_{i} ‖_{2}^{3}]$ , і $‖ \cdot ‖_{2}$ позначає Евклідову норму для $R^{d}$ .

Не відомо чи множник $d^{1 / 4}$ є необхідним.^[7]

Узагальнена теорема

Центральна гранична теорема стверджує, що сума деякої кількості незалежних і однаково розподілених випадкових величин із скінченною дисперсією буде прямувати до нормального розподілу із збільшенням кількості цих величин. Узагальнена її версія, яку запропонували Гнєденко і Колмогоров стверджує, що сума деякої кількості випадкових величин із розподілами, що мають хвіст, який відповідає степеневому закону (Хвіст розподілу Парето), зменшується як |x|Шаблон:Math де Шаблон:Math (і таким чином має нескінченну дисперсію) буде прямувати до стійкого розподілу Шаблон:Math із тим як кількість елементів суми збільшується.^[8]^[9] Якщо Шаблон:Math, тоді сума збігається до стійкого розподілу із параметром стабільності який дорівнює 2, тобто Гауссового розподілу.^[10]

Доведення класичної ЦГТ

Центральна гранична теорема має просте доведення за допомогою характеристичних функцій.^[11] Воно подібне до доведення (слабкого) закону великих чисел.

Припустимо Шаблон:Math} є незалежними і однаково розподіленими випадковими величинами, кожна з яких має середнє Шаблон:Mvar і скінченну дисперсію Шаблон:Math. Сума Шаблон:Math має середнє Шаблон:Mvar і дисперсію Шаблон:Math. Розглянемо випадкову величину

Z_{n} = \frac{X_{1} + \dots + X_{n} - n μ}{\sqrt{n σ^{2}}} = \sum_{i = 1}^{n} \frac{X_{i} - μ}{\sqrt{n σ^{2}}} = \sum_{i = 1}^{n} \frac{1}{\sqrt{n}} Y_{i},

де в останньому кроці ми визначили нові випадкові величини Шаблон:Math, кожна з яких має нульове середнє і одиничну дисперсію (Шаблон:Math). Характеристична функція для Шаблон:Mvar має вигляд

φ_{Z_{n}} (t) = φ_{\sum_{i = 1}^{n} \frac{1}{\sqrt{n}} Y_{i}} (t) = φ_{Y_{1}} (\frac{t}{\sqrt{n}}) φ_{Y_{2}} (\frac{t}{\sqrt{n}}) \dots φ_{Y_{n}} (\frac{t}{\sqrt{n}}) = {[φ_{Y_{1}} (\frac{t}{\sqrt{n}})]}^{n},

Де в останньому кроці ми застосували факт, що всі Шаблон:Mvar однаково розподілені. Відповідно до теореми Тейлора характеристична функція для Шаблон:Math матиме вигляд,

φ_{Y_{1}} (\frac{t}{\sqrt{n}}) = 1 - \frac{t^{2}}{2 n} + o (\frac{t^{2}}{n}), (\frac{t}{\sqrt{n}}) \to 0

де Шаблон:Math є "[[Нотація_Ландау|нотацією маленького Шаблон:Mvar]]" для деякої функції від Шаблон:Mvar, яка прямує до нуля набагато швидше ніж Шаблон:Math. Відповідно до границі показникової функції (Шаблон:Math), характеристична функція для Шаблон:Mvar дорівнює

φ_{Z_{n}} (t) = {(1 - \frac{t^{2}}{2 n} + o (\frac{t^{2}}{n}))}^{n} \to e^{- \frac{1}{2} t^{2}}, n \to \infty .

Зауважимо, що всі терми старшого порядку в даному виразі зникають при границі де Шаблон:Math. Права сторона виразу дорівнює характеристичній функції стандартного нормального розподілу Шаблон:Math, із чого разом із Шаблон:Нп випливає, що розподіл Шаблон:Mvar буде наближатися до Шаблон:Math з тим як Шаблон:Math. Таким чином, сума Шаблон:Math буде наближатися до нормального розподілу Шаблон:Math, і значення вибіркового середнього

S_{n} = \frac{X_{1} + \dots + X_{n}}{n}

збігається до нормального розподілу Шаблон:Math, з чого випливає центральна гранична теорема.

Застосування і приклади

Простий приклад

Простим прикладом центральної граничною теореми є підкидання великої кількості ідентичних гральних кісток. Розподіл суми (або середнього) від тих чисел що випадуть буде добре апроксимуватися за допомогою нормального розподілу. Оскільки величини реального світу часто є збалансованою сумою багатьох неспостережувальних випадкових подій, центральна гранична теорема також частково пояснює те, що нормальний розподіл зустрічається досить часто. Вона також виправдовує застосування апроксимації для великих статистичних вибірок до нормального розподілу у контрольованих експериментах.

Типові застосування з реального життя

У літературі можна знайти велику кількість корисних і цікавих прикладів застосувань, пов'язаних із центральною граничною теоремою.^[12] Одним із таких прикладів^[13] є наступні ситуації:

Розподіл імовірності загальної пройденої відстані у випадковому блуканні (зміщеної або незміщеної) буде прямувати до нормального розподілу.
Підкидання великої кількості монет буде мати нормальний розподіл для загальної кількості випадання аверсів (або реверсів).

З іншої точки зору, центральна гранична теорема пояснює common appearance "дзвоноподібної кривої" при оцінках функції густини застосованих до даних реального світу. В таких випадках як електричний шум, екзаменаційні оцінки, і так далі, ми часто можемо розглядати одне конкретне вимірюване значення як зважене середнє великої кількості малих випадкових впливів. Використавши узагальнення центральної граничної теореми, ми можемо побачити, що дуже часто (хоча не завжди) це утворюватиме в результаті розподіл, що наближений до нормального.

В загальному розумінні, чим більше вимірювання є подібним до суми випадкових величин із однаковим впливом на результат, тим ближче воно буде до нормального розподілу. Це обґрунтовує поширене використання цього розподілу як такого, що відповідає впливам неспостережувальних змінних у моделях, таких як лінійні моделі.

Див. також

Шаблон:Портал

Закон великих чисел.

Джерела

Примітки

Шаблон:Reflist

Шаблон:Math-stub

↑ Шаблон:Cite book
↑ Шаблон:Cite book
↑ Шаблон:Cite paper
↑ Шаблон:Harvtxt
↑ Шаблон:Cite book
↑ Ryan O’Donnell (2014, Theorem 5.38) http://www.contrib.andrew.cmu.edu/~ryanod/?p=866 Шаблон:Webarchive
↑ Шаблон:Cite journal
↑ Шаблон:Cite book
↑ Шаблон:Cite book
↑ Шаблон:Cite book
↑ Шаблон:Cite web
↑ Dinov, Christou & Sánchez (2008)
↑ Шаблон:Cite web

[1] Шаблон:Cite book

[feller1-2] Шаблон:Cite book

[3] Шаблон:Cite paper

[4] Шаблон:Harvtxt

[5] Шаблон:Cite book

[6] Ryan O’Donnell (2014, Theorem 5.38) http://www.contrib.andrew.cmu.edu/~ryanod/?p=866 Шаблон:Webarchive

[7] Шаблон:Cite journal

[Voit2003a-8] Шаблон:Cite book

[9] Шаблон:Cite book

[Uchaikin-10] Шаблон:Cite book

[11] Шаблон:Cite web

[12] Dinov, Christou & Sánchez (2008)

[13] Шаблон:Cite web

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

Центральна гранична теорема

Зміст

Центральна гранична теорема для незалежних послідовностей

Класичне формулювання

Формулювання Ляпунова

Формулювання Ліндеберга

Багатовимірна ЦГТ

Узагальнена теорема

Доведення класичної ЦГТ

Застосування і приклади

Простий приклад

Типові застосування з реального життя

Див. також

Джерела

Примітки

Навігаційне меню

Центральна гранична теорема

Центральна гранична теорема для незалежних послідовностей

Класичне формулювання

Формулювання Ляпунова

Формулювання Ліндеберга

Багатовимірна ЦГТ

Узагальнена теорема

Доведення класичної ЦГТ

Застосування і приклади

Простий приклад

Типові застосування з реального життя

Див. також

Джерела

Примітки

Навігаційне меню

Пошук