Перевірка відношенням правдоподібностей
Шаблон:Не плутати2 Шаблон:Multiple issues
У статистиці переві́рка відно́шенням правдоподі́бностей — це статистична перевірка, що застосовується для порівняння допасованості двох моделей, одна з яких (нульова модель) є окремим випадком іншої (Шаблон:Нп моделі). Ця перевірка ґрунтується на відношенні правдоподібностей, яке виражає, в скільки разів правдоподібніше, що дані відповідають одній моделі, а не іншій. Це відношення правдоподібностей, або, рівнозначно, його логарифм, може потім застосовуватися для обчислення p-значення, або порівнюватися із Шаблон:Нп для ухвалення рішення, чи відкинути нульову модель на користь альтернативної моделі. Коли застосовується логарифм відношення правдоподібностей, така статистика відома як статистика відношення логарифмічних правдоподібностей, а розподіл імовірності цієї перевірної статистики, за припущення, що нульова модель є істинною, може бути наближено із застосуванням теореми Уїлкса.
У випадку порівняння двох моделей, кожна з яких не має відомих параметрів, застосування перевірки відношенням правдоподібностей може бути обґрунтовано Шаблон:Нп, яка показує, що така перевірка має найвищу потужність серед усіх конкурентів.Шаблон:Sfn
Застосування
Кожна з двох порівнюваних моделей, нульова модель та альтернативна модель, окремо співставляється з даними, і записується логарифмічна правдоподібність. Пробна статистика (що часто позначують через D) є подвоєною різницею цих логарифмічних правдоподібностей:
Модель із більшою кількістю параметрів завжди допасовуватиметься щонайменше так же добре (матиме рівну або більшу логарифмічну правдоподібність). Чи є вона суттєво кращою, і чи повинна їй тому віддаватися перевага, визначається виведенням імовірності або p-значення різниці D. Там, де нульова гіпотеза являє собою окремий випадок альтернативної гіпотези, розподіл імовірності статистичного критерію є приблизно хі-квадратним розподілом зі ступенями вільності, що дорівнюють df2 − df1.Шаблон:Sfn Символи df1 та df2 представляють кількість вільних параметрів моделей 1 та 2, відповідно, нульової та альтернативної.
Ось приклад застосування. Якщо нульова модель має 1 параметр та логарифмічну правдоподібність −8024, а альтернативна модель має 3 параметри та логарифмічну правдоподібність −8012, то ймовірністю цієї різниці є те, що й хі-квадрат значення +2·(8024 − 8012) = 24 з 3 − 1 = 2 ступенями вільності. Щоби статистика слідувала розподілові хі-квадрат, мусять виконуватися деякі припущення,Шаблон:Sfn і часто обчислюють емпіричні p-значення.
Перевірка відношенням правдоподібностей вимагає вкладених моделей, тобто таких моделей, що складнішу може бути перетворено на простішу накладенням набору обмежень на її параметри. Якщо моделі не є вкладеними, то натомість зазвичай може бути застосовано узагальнення перевірки відношенням правдоподібності: відносну правдоподібність.
Гіпотези проста-з-простою
Статистична модель часто є Шаблон:Нп функцій густини ймовірності або функцій маси ймовірності . Перевірка гіпотез проста-з-простою має повністю визначені моделі як за нульової гіпотези, так і за Шаблон:Нп, що для спрощення записуються в термінах фіксованих значень уявного параметра :
Зауважте, що за кожної з гіпотез розподіл даних є повністю визначеним; невідомих параметрів для оцінки немає. Перевірка відношенням правдоподібностей ґрунтується на відношенні правдоподібностей, що часто позначають через (велика грецька літера лямбда). Відношення правдоподібностей визначається таким чином:Шаблон:SfnШаблон:Sfn
або
де є функцією правдоподібності, а — функцією супремума. Зауважте, що деякі джерела можуть використовувати як визначення обернене.Шаблон:Sfn У встановленому тут вигляді відношення правдоподібностей є малим, якщо альтернативна модель є кращою за нульову, і перевірка відношенням правдоподібностей дає таке правило рішення:
- Якщо , не відхиляти ;
- Якщо , відхилити ;
- Відхилити з імовірністю , якщо
Значення зазвичай обираються для отримання вказаного рівня значущості за допомогою відношення . Шаблон:Нп стверджує, що ця перевірка відношенням правдоподібностей є найпотужнішою серед усіх перевірок рівня для цієї задачі.Шаблон:Sfn
Визначення (перевірка відношенням правдоподібностей для складених гіпотез)
Нульову гіпотезу часто задають, кажучи, що параметр належить до вказаної підмножини простору параметрів .
Функцією правдоподібності є (де є ФГІ або ФМІ), що є функцією від параметра при , фіксованому на значенні, що фактично спостерігалося, тобто на даних. Статистикою перевірки відношенням правдоподібності єШаблон:Sfn
Тут запис стосується функції супремума.
Перевірка відношенням правдоподібностей — це будь-яка перевірка з критичною областю (або областю відхилення) вигляду , де є числом, що задовольняє . Багато поширених перевірних статистик, таких як Z-критерій, F-критерій, перевірка хі-квадрат Пірсона та Шаблон:Не перекладено є перевірками вкладених моделей, і їх може бути сформульовано як відношення логарифмічних правдоподібностей або їхніх наближень.
Інтерпретація
Будучи функцією даних , відношення правдоподібностей є відтак статистикою. Перевірка відношенням правдоподібностей відхиляє нульову гіпотезу, якщо значення цієї статистики є замалим. Наскільки мале є замалим, залежить від рівня значущості перевірки, тобто від того, яка ймовірність помилок першого роду вважається терпимою (помилки першого роду складаються з відхилень нульової гіпотези, що насправді є істинними).
Чисельник відповідає максимальній правдоподібності спостережуваного виходу за нульової гіпотези. Знаменник відповідає максимальній правдоподібності спостережуваного виходу при варіюванні параметрів над усім параметричним простором. Чисельник цього відношення є меншим за знаменник. Отже, відношення правдоподібностей лежить між 0 та 1. Низькі значення відношення правдоподібностей означають, що трапляння спостережуваного результату було менш правдоподібним за нульової гіпотези в порівнянні з альтернативною. Високі значення цієї статистики означають, що трапляння спостережуваного виходу було майже настільки ж правдоподібним за нульової гіпотези, як і за альтернативної, й нульову гіпотезу не можна відкидати.
Шаблон:Якір Розподіл: теорема Уїлкса
Якщо розподіл відношення правдоподібностей, що відповідає певним нульовій та альтернативній гіпотезам, може бути визначено явно, то його можливо безпосередньо застосовувати для формування областей рішень (для прийняття/відхилення нульової гіпотези). Проте в більшості випадків точний розподіл відношення правдоподібностей, що відповідає певним гіпотезам, визначити дуже складно. Зручний результат, що приписують Шаблон:Нп, каже, що з наближенням розміру вибірки до перевірна статистика для вкладених моделей ставатиме асимптотично -розподіленою зі ступенями вільності, що дорівнюють різниці в розмірності та .Шаблон:Sfn Це означає, що для великого розмаїття гіпотез виконавець може обчислювати відношення правдоподібностей для даних, і порівнювати зі значенням , що відповідає бажаній статистичній значущості, в ролі наближеної статистичної перевірки.
Приклади
Підкидання монети
Як приклад, у випадку перевірки Пірсона ми могли би спробувати порівняти дві монети, щоби визначити, чи вони мають однакову ймовірність випадіння аверсу. Наші спостереження може бути внесено до таблиці спряженості з рядками, що відповідають монетам, та стовпчиками, що відповідають аверсам (Шаблон:Lang-en) та реверсам (Шаблон:Lang-en). Елементами таблиці спряження будуть кількості разів, яку на монеті цього рядка випав аверс та реверс. Вміст цієї таблиці є нашим спостереженням .
| Аверси | Реверси | |
|---|---|---|
| Монета 1 | ||
| Монета 2 |
Тут складається з можливих комбінацій значень параметрів , , та , що є ймовірністю того, що монети 1 та 2 впадуть аверсом або реверсом догори. Надалі та . Простір гіпотез обмежується звичайними обмеженнями на розподіл імовірності, та . Простір нульової гіпотези є підпростором, у якому . При позначенні через найкращих значень за гіпотези оцінка максимальної правдоподібності задається як
Аналогічно, оцінки максимальної правдоподібності за нульової гіпотези задаються як
що не залежить від монети .
Гіпотезу та нульову гіпотезу може бути злегка переписано так, щоби вони задовольняли такі обмеження, щоби логарифм відношення правдоподібностей мав бажаний гарний розподіл. Оскільки це обмеження спричиняє зведення двовимірної до одновимірної , то асимптотичним розподілом цієї перевірки буде , розподіл з одним ступенем вільності.
Для загального випадку таблиці спряженості статистику відношення логарифмічних правдоподібностей може бути переписано як
Примітки
Джерела
- Шаблон:Cite journal Шаблон:Ref-en
- Шаблон:Cite journal Шаблон:Ref-en
- Шаблон:Cite journal Шаблон:Ref-en
- Шаблон:Cite book Шаблон:Ref-en
- Шаблон:Cite book Шаблон:Ref-en
- Шаблон:Cite book Шаблон:Ref-en
- Шаблон:Cite book Шаблон:Ref-en