Перевірка відношенням правдоподібностей

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

Шаблон:Не плутати2 Шаблон:Multiple issues

У статистиці переві́рка відно́шенням правдоподі́бностей — це статистична перевірка, що застосовується для порівняння допасованості двох моделей, одна з яких (нульова модель) є окремим випадком іншої (Шаблон:Нп моделі). Ця перевірка ґрунтується на відношенні правдоподібностей, яке виражає, в скільки разів правдоподібніше, що дані відповідають одній моделі, а не іншій. Це відношення правдоподібностей, або, рівнозначно, його логарифм, може потім застосовуватися для обчислення p-значення, або порівнюватися із Шаблон:Нп для ухвалення рішення, чи відкинути нульову модель на користь альтернативної моделі. Коли застосовується логарифм відношення правдоподібностей, така статистика відома як статистика відношення логарифмічних правдоподібностей, а розподіл імовірності цієї перевірної статистики, за припущення, що нульова модель є істинною, може бути наближено із застосуванням теореми Уїлкса.

У випадку порівняння двох моделей, кожна з яких не має відомих параметрів, застосування перевірки відношенням правдоподібностей може бути обґрунтовано Шаблон:Нп, яка показує, що така перевірка має найвищу потужність серед усіх конкурентів.Шаблон:Sfn

Застосування

Кожна з двох порівнюваних моделей, нульова модель та альтернативна модель, окремо співставляється з даними, і записується логарифмічна правдоподібність. Пробна статистика (що часто позначують через D) є подвоєною різницею цих логарифмічних правдоподібностей:

D=2ln(likelihood for null modellikelihood for alternative model)=2ln(likelihood for null model)+2ln(likelihood for alternative model)

Модель із більшою кількістю параметрів завжди допасовуватиметься щонайменше так же добре (матиме рівну або більшу логарифмічну правдоподібність). Чи є вона суттєво кращою, і чи повинна їй тому віддаватися перевага, визначається виведенням імовірності або p-значення різниці D. Там, де нульова гіпотеза являє собою окремий випадок альтернативної гіпотези, розподіл імовірності статистичного критерію є приблизно хі-квадратним розподілом зі ступенями вільності, що дорівнюють df2 − df1.Шаблон:Sfn Символи df1 та df2 представляють кількість вільних параметрів моделей 1 та 2, відповідно, нульової та альтернативної.

Ось приклад застосування. Якщо нульова модель має 1 параметр та логарифмічну правдоподібність −8024, а альтернативна модель має 3 параметри та логарифмічну правдоподібність −8012, то ймовірністю цієї різниці є те, що й хі-квадрат значення +2·(8024 − 8012) = 24 з 3 − 1 = 2 ступенями вільності. Щоби статистика слідувала розподілові хі-квадрат, мусять виконуватися деякі припущення,Шаблон:Sfn і часто обчислюють емпіричні p-значення.

Перевірка відношенням правдоподібностей вимагає вкладених моделей, тобто таких моделей, що складнішу може бути перетворено на простішу накладенням набору обмежень на її параметри. Якщо моделі не є вкладеними, то натомість зазвичай може бути застосовано узагальнення перевірки відношенням правдоподібності: відносну правдоподібність.

Гіпотези проста-з-простою

Шаблон:Докладніше1

Статистична модель часто є Шаблон:Нп функцій густини ймовірності або функцій маси ймовірності f(x|θ). Перевірка гіпотез проста-з-простою має повністю визначені моделі як за нульової гіпотези, так і за Шаблон:Нп, що для спрощення записуються в термінах фіксованих значень уявного параметра θ:

H0:θ=θ0,H1:θ=θ1.

Зауважте, що за кожної з гіпотез розподіл даних є повністю визначеним; невідомих параметрів для оцінки немає. Перевірка відношенням правдоподібностей ґрунтується на відношенні правдоподібностей, що часто позначають через Λ (велика грецька літера лямбда). Відношення правдоподібностей визначається таким чином:Шаблон:SfnШаблон:Sfn

Λ(x)=L(θ0|x)L(θ1|x)=f(ixi|θ0)f(ixi|θ1)

або

Λ(x)=L(θ0x)sup{L(θx):θ{θ0,θ1}},

де L(θ|x) є функцією правдоподібності, а sup — функцією супремума. Зауважте, що деякі джерела можуть використовувати як визначення обернене.Шаблон:Sfn У встановленому тут вигляді відношення правдоподібностей є малим, якщо альтернативна модель є кращою за нульову, і перевірка відношенням правдоподібностей дає таке правило рішення:

Якщо Λ>c, не відхиляти H0;
Якщо Λ<c, відхилити H0;
Відхилити з імовірністю q, якщо Λ=c.

Значення c,q зазвичай обираються для отримання вказаного рівня значущості α за допомогою відношення qP(Λ=c|H0)+P(Λ<c|H0)=α. Шаблон:Нп стверджує, що ця перевірка відношенням правдоподібностей є найпотужнішою серед усіх перевірок рівня α для цієї задачі.Шаблон:Sfn

Визначення (перевірка відношенням правдоподібностей для складених гіпотез)

Нульову гіпотезу часто задають, кажучи, що параметр θ належить до вказаної підмножини Θ0 простору параметрів Θ.

H0:θΘ0H1:θΘ0

Функцією правдоподібності є L(θ|x)=f(x|θ) (де f(x|θ) є ФГІ або ФМІ), що є функцією від параметра θ при x, фіксованому на значенні, що фактично спостерігалося, тобто на даних. Статистикою перевірки відношенням правдоподібності єШаблон:Sfn

Λ(x)=sup{L(θx):θΘ0}sup{L(θx):θΘ}.

Тут запис sup стосується функції супремума.

Перевірка відношенням правдоподібностей — це будь-яка перевірка з критичною областю (або областю відхилення) вигляду {x|Λc}, де c є числом, що задовольняє 0c1. Багато поширених перевірних статистик, таких як Z-критерій, F-критерій, перевірка хі-квадрат Пірсона та Шаблон:Не перекладено є перевірками вкладених моделей, і їх може бути сформульовано як відношення логарифмічних правдоподібностей або їхніх наближень.

Інтерпретація

Будучи функцією даних x, відношення правдоподібностей є відтак статистикою. Перевірка відношенням правдоподібностей відхиляє нульову гіпотезу, якщо значення цієї статистики є замалим. Наскільки мале є замалим, залежить від рівня значущості перевірки, тобто від того, яка ймовірність помилок першого роду вважається терпимою (помилки першого роду складаються з відхилень нульової гіпотези, що насправді є істинними).

Чисельник відповідає максимальній правдоподібності спостережуваного виходу за нульової гіпотези. Знаменник відповідає максимальній правдоподібності спостережуваного виходу при варіюванні параметрів над усім параметричним простором. Чисельник цього відношення є меншим за знаменник. Отже, відношення правдоподібностей лежить між 0 та 1. Низькі значення відношення правдоподібностей означають, що трапляння спостережуваного результату було менш правдоподібним за нульової гіпотези в порівнянні з альтернативною. Високі значення цієї статистики означають, що трапляння спостережуваного виходу було майже настільки ж правдоподібним за нульової гіпотези, як і за альтернативної, й нульову гіпотезу не можна відкидати.

Шаблон:Якір Розподіл: теорема Уїлкса

Шаблон:Falseredirect

Якщо розподіл відношення правдоподібностей, що відповідає певним нульовій та альтернативній гіпотезам, може бути визначено явно, то його можливо безпосередньо застосовувати для формування областей рішень (для прийняття/відхилення нульової гіпотези). Проте в більшості випадків точний розподіл відношення правдоподібностей, що відповідає певним гіпотезам, визначити дуже складно. Зручний результат, що приписують Шаблон:Нп, каже, що з наближенням розміру вибірки n до перевірна статистика 2log(Λ) для вкладених моделей ставатиме асимптотично χ2-розподіленою зі ступенями вільності, що дорівнюють різниці в розмірності Θ та Θ0.Шаблон:Sfn Це означає, що для великого розмаїття гіпотез виконавець може обчислювати відношення правдоподібностей Λ для даних, і порівнювати 2log(Λ) зі значенням χ2, що відповідає бажаній статистичній значущості, в ролі наближеної статистичної перевірки.

Приклади

Підкидання монети

Як приклад, у випадку перевірки Пірсона ми могли би спробувати порівняти дві монети, щоби визначити, чи вони мають однакову ймовірність випадіння аверсу. Наші спостереження може бути внесено до таблиці спряженості з рядками, що відповідають монетам, та стовпчиками, що відповідають аверсам (Шаблон:Lang-en) та реверсам (Шаблон:Lang-en). Елементами таблиці спряження будуть кількості разів, яку на монеті цього рядка випав аверс та реверс. Вміст цієї таблиці є нашим спостереженням X.

Аверси Реверси
Монета 1 k1H k1T
Монета 2 k2H k2T

Тут Θ складається з можливих комбінацій значень параметрів p1H, p1T, p2H та p2T, що є ймовірністю того, що монети 1 та 2 впадуть аверсом або реверсом догори. Надалі i=1,2 та j=H,T. Простір гіпотез H обмежується звичайними обмеженнями на розподіл імовірності, 0pij1 та piH+piT=1. Простір нульової гіпотези H0 є підпростором, у якому p1j=p2j. При позначенні через nij найкращих значень pij за гіпотези H оцінка максимальної правдоподібності задається як

nij=kijkiH+kiT.

Аналогічно, оцінки максимальної правдоподібності pij за нульової гіпотези H0 задаються як

mij=k1j+k2jk1H+k2H+k1T+k2T,

що не залежить від монети i.

Гіпотезу та нульову гіпотезу може бути злегка переписано так, щоби вони задовольняли такі обмеження, щоби логарифм відношення правдоподібностей мав бажаний гарний розподіл. Оскільки це обмеження спричиняє зведення двовимірної H до одновимірної H0, то асимптотичним розподілом цієї перевірки буде χ2(1), розподіл χ2 з одним ступенем вільності.

Для загального випадку таблиці спряженості статистику відношення логарифмічних правдоподібностей може бути переписано як

2logΛ=2i,jkijlognijmij.

Примітки

Шаблон:Примітки

Джерела

Шаблон:Refbegin

Шаблон:Refend

Посилання

Шаблон:Статистика