Критерій узгодженості Пірсона

Матеріал з testwiki
Перейти до навігації Перейти до пошуку
Файл:Критерій Пірсона.jpg

Критерій узгодженості Пірсона — один з найвідоміших критеріїв χ2, тому його часто і називають просто «критерій хі-квадрат». Використовується для перевірки гіпотези про закон розподілу.

Ґрунтується на групованих даних. Область значень передбачуваного розподілу ϝ1 ділять на деяке число інтервалів.
Після чого будують функцію відхилення ρ по різницях теоретичних імовірностей потрапляння в інтервали групування й емпіричних частот.

Нехай X=(X1,…, Xn) — вибірка з розподілу ϝ. Перевіряється проста гіпотеза H1=ϝ=ϝ1 проти складної альтернативи H2=ϝϝ1.
Нехай A1,…, Ak — інтервали групування в області значень випадкової величини з розподілом ϝ1.
Позначимо для j=1,…,k через νj число елементів вибірки, що потрапили в інтервал Aj:
νj=(XiAj)=i=1nI(XiAj),

і через pj>0 — теоретичну ймовірність PH1(X1Aj) попадання в інтервал Aj випадкової величини з розподілом ϝ1.
З необхідністю, p1+...+pk=1.
Як правило, довжини інтервалів вибирають так, щоб p1=...=pk=1k.
Нехай ρ(X)=j=1k(νjnpj)2npj (1).

Зауваження

Якщо розподіл вибірки ϝ2ϝ1 має такі ж, як в ϝ1, імовірності pj попадання в кожний з інтервалів Al, то по даній функції ρці розподіли розрізнити неможливо.
Тому насправді критерій, який ми побудуємо по функції ρз (1), вирішує зовсім інше завдання. А саме, нехай заданий набір імовірностей p1,...,pk такий, що p1+...+pk=1. Критерій χ2 призначений для перевірки складної гіпотези H2'={розподіл Х1 має властивість: Р(Х1 ∈ Аj)=pj для всіх j=1,…,k} проти складної альтернативи H2'={H1' невірна}, тобто H2'={хоча б для одного з інтервалів ймовірність P(X1 ∈ Аj) відізняється від pj}

Правило критерію

Перед тим, як сформулювати правило прийняття або відкидання гіпотези необхідно врахувати, що критерій Пірсона має правобічну критичну область. Шаблон:Mbox

Теорема Пірсона

Якщо вірна гіпотеза H1', то при фіксованому k й при n: ρ(X)=j=1k(νjnpj)2npjHk1,

де, нагадаємо,Hk1, є χ2-розподіл зі k1 ступенем вільності.

Зауваження

Насправді критерій χ2 застосовують і для розв'язку первісного завдання про перевірку гіпотези H1=ϝ=ϝ1. Необхідно тільки пам'ятати, що цей критерій недостатній для альтернатив з тими ж імовірностями попадання в інтервали розбиття, що й в ϝ1. Тому беруть велику кількість інтервалів розбиття — чим більше, тим краще, щоб «зменшити» число альтернатив, нерозрізнених з передбачуваним розподілом.

Критерій Пірсона для перевірки параметричної гіпотези

Критерій χ2 часто застосовують для перевірки гіпотези про вид розподілу, тобто про приналежність розподілу вибірки деякому параметричному сімейству. Є вибірка X=(X1,...,Xn) з невідомого розподілуϝ .
Перевіряється складна гіпотеза: H1=ϝϝθ,

де θϵΘl — невідомий параметр (скалярний або векторний), l- його розмірність.
Нехай розбите на k>lінтервалів A1...Ak, і νj — число елементів вибірки, що потрапили вAj. Але ймовірність pj=PH1(X1Aj)=pj(θ) тепер залежить від невідомого параметра .
Функція відхилення (1) також залежить від невідомого параметра, і використовувати її в критерії Пірсона не можна — ми не можемо обчислити її значення: ρ(X,θ)=j=1k(νjnpj(θ))2npj(θ)(2.)
Нехай θ^=θ^(X)- значення параметра θ, що доставляє мінімум функції ρ(X,θ) при даній вибірці X .
Підставивши замість дійсних імовірностей pjїх оцінки pj(θ^) , одержимо функцію відхилення:ρ(X,θ^)=j=1k(νjnpj(θ^))2npj(θ^).

Див. також

Джерела

Шаблон:Статистика