Перевірка відношенням правдоподібностей

Шаблон:Не плутати2 Шаблон:Multiple issues

У статистиці переві́рка відно́шенням правдоподі́бностей — це статистична перевірка, що застосовується для порівняння допасованості двох моделей, одна з яких (нульова модель) є окремим випадком іншої (Шаблон:Нп моделі). Ця перевірка ґрунтується на відношенні правдоподібностей, яке виражає, в скільки разів правдоподібніше, що дані відповідають одній моделі, а не іншій. Це відношення правдоподібностей, або, рівнозначно, його логарифм, може потім застосовуватися для обчислення p-значення, або порівнюватися із Шаблон:Нп для ухвалення рішення, чи відкинути нульову модель на користь альтернативної моделі. Коли застосовується логарифм відношення правдоподібностей, така статистика відома як статистика відношення логарифмічних правдоподібностей, а розподіл імовірності цієї перевірної статистики, за припущення, що нульова модель є істинною, може бути наближено із застосуванням теореми Уїлкса.

У випадку порівняння двох моделей, кожна з яких не має відомих параметрів, застосування перевірки відношенням правдоподібностей може бути обґрунтовано Шаблон:Нп, яка показує, що така перевірка має найвищу потужність серед усіх конкурентів.Шаблон:Sfn

Застосування

Кожна з двох порівнюваних моделей, нульова модель та альтернативна модель, окремо співставляється з даними, і записується логарифмічна правдоподібність. Пробна статистика (що часто позначують через D) є подвоєною різницею цих логарифмічних правдоподібностей:

\begin{matrix} D & = - 2 \ln (\frac{likelihood for null model}{likelihood for alternative model}) \\ = - 2 \ln (likelihood for null model) + 2 \ln (likelihood for alternative model) \end{matrix}

Модель із більшою кількістю параметрів завжди допасовуватиметься щонайменше так же добре (матиме рівну або більшу логарифмічну правдоподібність). Чи є вона суттєво кращою, і чи повинна їй тому віддаватися перевага, визначається виведенням імовірності або p-значення різниці D. Там, де нульова гіпотеза являє собою окремий випадок альтернативної гіпотези, розподіл імовірності статистичного критерію є приблизно хі-квадратним розподілом зі ступенями вільності, що дорівнюють df2 − df1.Шаблон:Sfn Символи df1 та df2 представляють кількість вільних параметрів моделей 1 та 2, відповідно, нульової та альтернативної.

Ось приклад застосування. Якщо нульова модель має 1 параметр та логарифмічну правдоподібність −8024, а альтернативна модель має 3 параметри та логарифмічну правдоподібність −8012, то ймовірністю цієї різниці є те, що й хі-квадрат значення +2·(8024 − 8012) = 24 з 3 − 1 = 2 ступенями вільності. Щоби статистика слідувала розподілові хі-квадрат, мусять виконуватися деякі припущення,Шаблон:Sfn і часто обчислюють емпіричні p-значення.

Перевірка відношенням правдоподібностей вимагає вкладених моделей, тобто таких моделей, що складнішу може бути перетворено на простішу накладенням набору обмежень на її параметри. Якщо моделі не є вкладеними, то натомість зазвичай може бути застосовано узагальнення перевірки відношенням правдоподібності: відносну правдоподібність.

Гіпотези проста-з-простою

Шаблон:Докладніше1

Статистична модель часто є Шаблон:Нп функцій густини ймовірності або функцій маси ймовірності $f (x | θ)$ . Перевірка гіпотез проста-з-простою має повністю визначені моделі як за нульової гіпотези, так і за Шаблон:Нп, що для спрощення записуються в термінах фіксованих значень уявного параметра $θ$ :

\begin{matrix} H_{0} & : & θ = θ_{0}, \\ H_{1} & : & θ = θ_{1} . \end{matrix}

Зауважте, що за кожної з гіпотез розподіл даних є повністю визначеним; невідомих параметрів для оцінки немає. Перевірка відношенням правдоподібностей ґрунтується на відношенні правдоподібностей, що часто позначають через $Λ$ (велика грецька літера лямбда). Відношення правдоподібностей визначається таким чином:Шаблон:Sfn Шаблон:Sfn

Λ (x) = \frac{L (θ_{0} | x)}{L (θ_{1} | x)} = \frac{f (\cup_{i} x_{i} | θ_{0})}{f (\cup_{i} x_{i} | θ_{1})}

або

Λ (x) = \frac{L (θ_{0} ∣ x)}{\sup {L (θ ∣ x) : θ \in {θ_{0}, θ_{1}}}},

де $L (θ | x)$ є функцією правдоподібності, а $\sup$ — функцією супремума. Зауважте, що деякі джерела можуть використовувати як визначення обернене.Шаблон:Sfn У встановленому тут вигляді відношення правдоподібностей є малим, якщо альтернативна модель є кращою за нульову, і перевірка відношенням правдоподібностей дає таке правило рішення:

Якщо

Λ > c

, не відхиляти

H_{0}

;

Якщо

Λ < c

, відхилити

H_{0}

;

Відхилити з імовірністю

q

, якщо

Λ = c .

Значення $c, q$ зазвичай обираються для отримання вказаного рівня значущості $α$ за допомогою відношення $q \cdot P (Λ = c | H_{0}) + P (Λ < c | H_{0}) = α$ . Шаблон:Нп стверджує, що ця перевірка відношенням правдоподібностей є найпотужнішою серед усіх перевірок рівня $α$ для цієї задачі.Шаблон:Sfn

Визначення (перевірка відношенням правдоподібностей для складених гіпотез)

Нульову гіпотезу часто задають, кажучи, що параметр $θ$ належить до вказаної підмножини $Θ_{0}$ простору параметрів $Θ$ .

\begin{matrix} H_{0} & : & θ \in Θ_{0} \\ H_{1} & : & θ \in Θ_{0}^{∁} \end{matrix}

Функцією правдоподібності є $L (θ | x) = f (x | θ)$ (де $f (x | θ)$ є ФГІ або ФМІ), що є функцією від параметра $θ$ при $x$ , фіксованому на значенні, що фактично спостерігалося, тобто на даних. Статистикою перевірки відношенням правдоподібності єШаблон:Sfn

Λ (x) = \frac{\sup {L (θ ∣ x) : θ \in Θ_{0}}}{\sup {L (θ ∣ x) : θ \in Θ}} .

Тут запис $\sup$ стосується функції супремума.

Перевірка відношенням правдоподібностей — це будь-яка перевірка з критичною областю (або областю відхилення) вигляду ${x | Λ \leq c}$ , де $c$ є числом, що задовольняє $0 \leq c \leq 1$ . Багато поширених перевірних статистик, таких як Z-критерій, F-критерій, перевірка хі-квадрат Пірсона та Шаблон:Не перекладено є перевірками вкладених моделей, і їх може бути сформульовано як відношення логарифмічних правдоподібностей або їхніх наближень.

Інтерпретація

Будучи функцією даних $x$ , відношення правдоподібностей є відтак статистикою. Перевірка відношенням правдоподібностей відхиляє нульову гіпотезу, якщо значення цієї статистики є замалим. Наскільки мале є замалим, залежить від рівня значущості перевірки, тобто від того, яка ймовірність помилок першого роду вважається терпимою (помилки першого роду складаються з відхилень нульової гіпотези, що насправді є істинними).

Чисельник відповідає максимальній правдоподібності спостережуваного виходу за нульової гіпотези. Знаменник відповідає максимальній правдоподібності спостережуваного виходу при варіюванні параметрів над усім параметричним простором. Чисельник цього відношення є меншим за знаменник. Отже, відношення правдоподібностей лежить між 0 та 1. Низькі значення відношення правдоподібностей означають, що трапляння спостережуваного результату було менш правдоподібним за нульової гіпотези в порівнянні з альтернативною. Високі значення цієї статистики означають, що трапляння спостережуваного виходу було майже настільки ж правдоподібним за нульової гіпотези, як і за альтернативної, й нульову гіпотезу не можна відкидати.

Шаблон:Якір Розподіл: теорема Уїлкса

Шаблон:Falseredirect

Якщо розподіл відношення правдоподібностей, що відповідає певним нульовій та альтернативній гіпотезам, може бути визначено явно, то його можливо безпосередньо застосовувати для формування областей рішень (для прийняття/відхилення нульової гіпотези). Проте в більшості випадків точний розподіл відношення правдоподібностей, що відповідає певним гіпотезам, визначити дуже складно. Зручний результат, що приписують Шаблон:Нп, каже, що з наближенням розміру вибірки $n$ до $\infty$ перевірна статистика $- 2 \log (Λ)$ для вкладених моделей ставатиме асимптотично $χ^{2}$ -розподіленою зі ступенями вільності, що дорівнюють різниці в розмірності $Θ$ та $Θ_{0}$ .Шаблон:Sfn Це означає, що для великого розмаїття гіпотез виконавець може обчислювати відношення правдоподібностей $Λ$ для даних, і порівнювати $- 2 \log (Λ)$ зі значенням $χ^{2}$ , що відповідає бажаній статистичній значущості, в ролі наближеної статистичної перевірки.

Приклади

Підкидання монети

Як приклад, у випадку перевірки Пірсона ми могли би спробувати порівняти дві монети, щоби визначити, чи вони мають однакову ймовірність випадіння аверсу. Наші спостереження може бути внесено до таблиці спряженості з рядками, що відповідають монетам, та стовпчиками, що відповідають аверсам (Шаблон:Lang-en) та реверсам (Шаблон:Lang-en). Елементами таблиці спряження будуть кількості разів, яку на монеті цього рядка випав аверс та реверс. Вміст цієї таблиці є нашим спостереженням $X$ .

	Аверси	Реверси
Монета 1	$k_{1 H}$	$k_{1 T}$
Монета 2	$k_{2 H}$	$k_{2 T}$

Тут $Θ$ складається з можливих комбінацій значень параметрів $p_{1 H}$ , $p_{1 T}$ , $p_{2 H}$ та $p_{2 T}$ , що є ймовірністю того, що монети 1 та 2 впадуть аверсом або реверсом догори. Надалі $i = 1, 2$ та $j = H, T$ . Простір гіпотез $H$ обмежується звичайними обмеженнями на розподіл імовірності, $0 \leq p_{i j} \leq 1$ та $p_{i H} + p_{i T} = 1$ . Простір нульової гіпотези $H_{0}$ є підпростором, у якому $p_{1 j} = p_{2 j}$ . При позначенні через $n_{i j}$ найкращих значень $p_{i j}$ за гіпотези $H$ оцінка максимальної правдоподібності задається як

$n_{i j} = \frac{k_{i j}}{k_{i H} + k_{i T}} .$

Аналогічно, оцінки максимальної правдоподібності $p_{i j}$ за нульової гіпотези $H_{0}$ задаються як

$m_{i j} = \frac{k_{1 j} + k_{2 j}}{k_{1 H} + k_{2 H} + k_{1 T} + k_{2 T}},$

що не залежить від монети $i$ .

Гіпотезу та нульову гіпотезу може бути злегка переписано так, щоби вони задовольняли такі обмеження, щоби логарифм відношення правдоподібностей мав бажаний гарний розподіл. Оскільки це обмеження спричиняє зведення двовимірної $H$ до одновимірної $H_{0}$ , то асимптотичним розподілом цієї перевірки буде $χ^{2} (1)$ , розподіл $χ^{2}$ з одним ступенем вільності.

Для загального випадку таблиці спряженості статистику відношення логарифмічних правдоподібностей може бути переписано як

- 2 \log Λ = 2 \sum_{i, j} k_{i j} \log \frac{n_{i j}}{m_{i j}} .

Примітки

Шаблон:Примітки

Джерела

Шаблон:Refbegin

Шаблон:Refend

Посилання

Шаблон:Статистика

Перевірка відношенням правдоподібностей

Зміст

Застосування

Гіпотези проста-з-простою

Визначення (перевірка відношенням правдоподібностей для складених гіпотез)

Інтерпретація

Шаблон:Якір Розподіл: теорема Уїлкса

Приклади

Підкидання монети

Примітки

Джерела

Посилання

Навігаційне меню

Перевірка відношенням правдоподібностей

Застосування

Гіпотези проста-з-простою

Визначення (перевірка відношенням правдоподібностей для складених гіпотез)

Інтерпретація

Шаблон:Якір Розподіл: теорема Уїлкса

Приклади

Підкидання монети

Примітки

Джерела

Посилання

Навігаційне меню

Пошук