Розподіл хі-квадрат

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

Шаблон:Розподіл ймовірностей

Розподіл хі-квадрат (Шаблон:Nowrap) з 'n' ступенями вільності — неперервний розподіл, що визначається як розподіл суми квадратів 'n' незалежних випадкових величин з стандартним нормальним розподілом. Тобто якщо ξ1, ..., ξn — незалежні стандартні нормальні випадкові величини, то випадкова величина Xn212+...+ξn2 матиме розподіл хі-квадрат з 'n' ступенями вільності.

Розподіл хі-квадрат є одним з найважливіших у статистиці. Зокрема він використовується у критеріях хі-квадрат (наприклад критерії узгодженості Пірсона).

Розподіл хі-квадрат є частковим випадком гамма-розподілу.

Вступ

Ланкастер[1] показав зв'язок між біноміальним, нормальним і хі-квадрат розподілами, як показано нижче. Де Муавр і Лаплас встановили, що біноміальний розподіл можна наблизити через нормальний розподіл. Точніше вони показали асимптотичну нормальність випадкової величини

χ=mNp(Npq),

де m — це спостережена кількість успіхів в N спробах, де ймовірність успіху p, а q = 1 − p.

Підносимо до квадрату обидві частини рівняння

χ2=(mNp)2(Npq)

Використовуючи N = Np + N(1 − p), N = m + (Nm), та q = 1 − p, це рівняння спрощується до

χ2=(mNp)2(Np)+((Nm)Nq)2(Nq)

Вираз праворуч має форму, яку Пірсон узагальнив до:

χ2=i=1n(OiEi)2Ei,

де

χ2 — кумулятивна тестова статистика Пірсона, яка асимптотично наближується до χ2 розподілу.
Oi — кількість спостережень типу i.
EiNpi — очікувана (теоретична) частота типу i, згідно з нульовою гіпотезою, яка стверджує, що частка типу i в популяції становить pi
n — кількість комірок в таблиці.

У випадку біноміального виходу (підкидання монети), біноміальний розподіл можна апроксимувати через нормальний (для досить великих n). З того, що квадрат нормального розподілу — це розподіл хі-квадрат з одним ступенем вільності, ймовірність результату як-от 1 аверс з 10 спроб, можна апроксимувати через нормальний розподіл чи розподіл хі-квадрат. Однак, багато задач потребують більше ніж два виходи як у біноміальному випадку, натомість вони потребують 3 або більше категорій, що призводить до поліноміального розподілу. Просто де Муавр і Лаплас шукали і знайшли нормальне наближення до біноміального, Пірсон шукав і знайшов багатовимірне нормальне наближення до поліноміального розподілу. Пірсон показав, що розподіл хі-квадрат, сума багатьох нормальних розподілів, був таким наближенням до поліноміального розподілу.[1]

Розподіл хі-квадрат

Щільність імовірності

Розподіл хі-квадрат зосереджений на додатній півосі і має щільність:

Px2(n)(x)={0,if x<01Γ(n/2)2n/2xn/21ex/2,if x 0,

де Γ(α)=0tα1etdtгамма-функція.

Функція розподілу

Функція розподілу хі-квадрат розподілу записується

1Γ(k/2)γ(k/2,x/2)

При n>+2 χ2-розподіл має моду в точці x = n - 2. Характеристична функція χ2-розподілу має вигляд f(t)=(1-2it)-n/2.
Математичне сподівання і дисперсія розподілу хі-квадрат рівні, відповідно, n і 2n.

Властивості χ2-розподілу

  • Розподіл хі-квадрат є стійким відносно додавання. Якщо Y1, Y2 незалежні, і Y1χ2(n1),Y2χ2(n2), то Y1+Y2χ2(n1+n2)
  • З визначення легко отримати моменти розподілу хі-квадрат. Якщо Yχ2(n) то E[Y]=nD[Y]=2n
  • Через центральну граничну теорему, при великому числі ступенів вільності розподіл випадкової величини Yχ2(n) може бути наближений нормальним YN(n,2n). Точніше Yn2nN(0,1) по розподілу при n.

Застосування

Сума незалежних випадкових величин Xn12+...+Xnk2 з n1, n2 ..., nk ступенями вільності, відповідно, підкоряється хі-квадрат розподілу з n = n1 + n2 + ... + nk ступенями вільності. Завдяки тісному зв'язку з нормальним розподілом χ2-розподіл відіграє важливу роль в теорії ймовірностей і математичній статистиці. χ2-розподіл, і багато інших розподілів, які визначаються за допомогою χ2-розподілу (наприклад — розподіл Стьюдента), описують вибіркові розподіли різних функцій від нормально розподілених результатів спостережень і використовуються для побудови довірчих інтервалів і статистичних критеріїв.

Так, наприклад, для незалежних випадкових величин x1, x2 ..., xn з однаковим нормальним розподілом з математичним сподіванням а і дисперсією δ2 відношення s22 ,
де s=i=1n(xixcp)2n1, xcp=i=1nxin
підкоряється χ2-розподілу з n - 1 ступенями вільності при будь-яких значеннях а і δ2. Цей результат покладений в основу побудови довірчих інтервалів і критерію для перевірки гіпотези про невідоме значення дисперсії у разі, коли середнє значення випадкової величини також невідоме (перевірка статистичних гіпотез і інтервальна статистична оцінка).

Особливу популярність у зв'язку з хі-квадрат розподілом отримав критерій хі-квадрат, заснований на так званій хі-квадрат статистиці Пірсона. Є детальні таблиці χ2-розподілу, зручні для статистичних розрахунків. При великих обсягах вибірок використовують апроксимацію за допомогою нормального розподілу. При n, згідно з центральною граничною теоремою, розподіл нормальної величини прагне до нормального розподілу.

Вперше χ2-розподіл було розглянуто Р.Хельмертом (1876) і Карлом Пірсоном (1900).

Джерела

Примітки

Шаблон:Reflist

Шаблон:Перекласти Шаблон:Список розподілів ймовірності