Баєсів інформаційний критерій

Матеріал з testwiki
Версія від 04:23, 2 січня 2024, створена imported>InternetArchiveBot (Bluelink 1 book for Перевірність (20240101)) #IABot (v2.0.9.5) (GreenC bot)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Шаблон:Баєсова статистика У статистиці, ба́єсів інформаці́йний крите́рій (БІК, Шаблон:Lang-en), або крите́рій Шва́рца (Шаблон:Lang-en, також Шаблон:Lang-en) — статистичний критерій для обирання моделі серед скінченної множини моделей; найприйнятнішою є модель із найнижчим БІК. Він ґрунтується, зокрема, на функції правдоподібності, і тісно пов'язаний з інформаційним критерієм Акаіке (ІКА).

При допасовуванні моделей можливо підвищувати правдоподібність шляхом додавання параметрів, але це може призводити до перенавчання. Як БІК, так і ІКА намагаються розв'язувати цю проблему введенням члена штрафу для числа параметрів у моделі; член штрафу в БІК є більшим, ніж в ІКА.

БІК було розроблено Шаблон:H:title, і опубліковано в праці 1978 року,[1] в якій він навів баєсове обґрунтування його застосування.

Визначення

БІК формально визначається як[2]

BIC=ln(n)k2ln(L^). 

де

БІК є асимптотичним результатом, виведеним за припущення, що розподіл даних належить до Шаблон:Нп. Тобто, інтеграл функції правдоподібності p(x|θ,M), помножений на апріорний розподіл ймовірності p(θ|M) над параметрами θ моделі M, для незмінних спостережених даних x наближується як

2lnp(x|M)BIC=2lnL^+k(ln(n)ln(2π)). 

Для великих n це може бути наближено наведеною вище формулою. БІК використовують в задачах обирання моделі, що в них додавання сталої до БІК не змінює результату.

Властивості

Шаблон:Refimprovesect

  • Він не залежить від апріорного, або апріорне є «невизначеним» (сталою).
  • Він може вимірювати ефективність параметризованої моделі в термінах передбачування даних.
  • Він штрафує складність моделі, де складність позначає кількість параметрів моделі.
  • Він наближено дорівнює критерієві мінімальної довжини опису, але з протилежним знаком.
  • Його можна застосовувати для обирання числа кластерів відповідно до внутрішньої складності, присутньої в певному наборі даних.
  • Він тісно пов'язаний з іншими критеріями штрафованої правдоподібності, такими як Шаблон:Прояснити та інформаційний критерій Акаіке.

Обмеження

Критерій БІК страждає на два головні обмеження[3]

  1. наведене вище наближення чинне лише для розміру вибірки n, який є набагато більшим за число параметрів моделі k.
  2. БІК не може обробляти складні зібрання моделей, як у задачі обирання змінних (або обирання ознак) за високої розмірності.[3]

Гаусів особливий випадок

За припущення, що похибки або збурення моделі є незалежними та однаково розподіленими згідно нормального розподілу, і граничної умови, що похідна логарифмічної правдоподібності щодо істинної дисперсії є нульовою, це перетворюється (з точністю до адитивної сталої, яка залежить від n, але не від моделі) на[4]

BIC=nln(σe2^)+kln(n) 

де σe2^ є дисперсією похибки. Дисперсію похибки в цьому випадку визначають як

σe2^=1ni=1n(xixi^)2

що є зсунутою оцінкою істинної дисперсії.

В термінах Шаблон:Нп БІК є

BIC=nln(RSS/n)+kln(n) 

При перевірці декількох лінійних моделей відносно насиченої моделі БІК може бути переписано в термінах Шаблон:Нп χ2 як[5]

BIC=χ2+kln(n)

де k є числом параметрів моделі в перевірці.

При обиранні з декількох моделей найприйнятнішою є модель із найнижчим БІК. БІК є висхідною функцією дисперсії похибки σe2, і висхідною функцією k. Тобто, незрозуміла дисперсія в залежній змінній та число описових змінних збільшують значення БІК. Отже, нижчий БІК означає або меншу кількість описових змінних, або кращу допасованість, або обидві. Силу свідчення проти моделі з вищим БІК може бути узагальнено наступним чином:[5]

ΔБІК Свідчення проти вищого БІК
0 to 2 Не варте більше ніж просто згадування
2 to 6 Позитивне
6 to 10 Сильне
>10 Дуже сильне

БІК зазвичай штрафує вільні параметри сильніше за Інформаційний критерій Акаіке, хоча це залежить від розміру n і відносної величини n і k.

Важливо мати на увазі, що БІК можна застосовувати для порівняння оцінюваних моделей лише якщо числові значення залежної змінної є однаковими для всіх порівнюваних оцінок. Порівнюваним моделям не потрібно бути вкладеними, на відміну від випадку, коли моделі порівнюють із застосуванням критерію Фішера або перевірки відношенням правдоподібностей.

Див. також

Примітки

Шаблон:Примітки

Джерела

Посилання