Баєсове ієрархічне моделювання
Ба́єсове ієрархі́чне моделюва́ння (Шаблон:Lang-en) — це статистична модель, написана в декілька рівнів (ієрархічний вигляд), яка оцінює Шаблон:Нп апостеріорного розподілу із застосуванням баєсового методу.[1] Підмоделі об'єднуються для утворення ієрархічної моделі, а для поєднання їх в одне ціле зі спостережуваними даними та врахуванням всієї присутньої невизначеності застосовується теорема Баєса. Результатом цього поєднання є апостеріорний розподіл, відомий також як уточнена оцінка ймовірності за отримання додаткового свідчення про апріорний розподіл.
Частотницька статистика, популярніша Шаблон:Нп, може видавати висновки, здавалося би, несумісні з тими, що пропонує баєсова статистика, через баєсове трактування параметрів як випадкових змінних, і використання суб'єктивної інформації у встановленні припущень стосовно цих параметрів.[2] Оскільки ці підходи дають відповіді на різні питання, то формальні результати не є технічно суперечливими, але ці два підходи не погоджуються стосовно того, яка відповідь є доречною для певного застосування. Баєсівці переконують, що доречною інформацією стосовно ухвалення рішень та уточнення переконань нехтувати не можна, і що ієрархічне моделювання має потенціал взяти гору над класичними методами в застосуваннях, в яких доповідачі дають декілька варіантів даних спостережень. Більше того, ця модель довела свою робастність, з меншою чутливістю апостеріорного розподілу до гнучкіших ієрархічних апріорних.
Ієрархічне моделювання застосовують, коли інформація є доступною на декількох різних рівнях одиниць вимірювання. Ієрархічна форма аналізу та організації допомагає в розумінні багатопараметрових задач, а також відіграє важливу роль у розробці обчислювальних стратегій.Шаблон:Sfn
Філософія
Численні статистичні застосування передбачають декілька параметрів, які можливо розглядати як пов'язані або взаємопоєднані таким чином, що ця задача передбачає залежність моделі спільної ймовірності для цих параметрів.Шаблон:Sfn Окремі міри переконань, виражені у вигляді ймовірностей, мають свою невизначеність.[3] Крім цього, є зміна мір переконань з часом. Як було зазначено професором Шаблон:Нп та професором Шаблон:Нп, «Реальність процесу навчання складається з розвитку окремих та суб'єктивних переконань про дійсність.» Ці суб'єктивні ймовірності залучаються в розумі пряміше, ніж фізичні ймовірності.[4] Відтак, саме через цю потребу уточнювати переконання баєсівці сформулювали альтернативну статистичну модель, яка враховує попереднє трапляння певної події.[5]
Теорема Баєса
Передбачуване трапляння реальної події зазвичай змінюватиме переваги між певними варіантами. Це здійснюється змінюванням мір переконання, закріплених особою за подіями, що визначають ці варіанти.Шаблон:Sfn
Припустімо, що в дослідженні дієвості серцевого лікування з пацієнтами лікарні j, що має ймовірність виживання , ймовірність виживання уточнюватиметься траплянням y, події створення гіпотетичної дискусійної сироватки, яка, як дехто вважає, збільшує виживаність серцевих пацієнтів.
Щоби зробити уточнені ймовірнісні твердження про , маючи трапляння події y, ми мусимо почати з моделі, яка забезпечує спільний розподіл імовірності для та y. Це може бути записано як добуток двох розподілів, які часто називають апріорним розподілом та вибірковим розподілом відповідно:
З використанням основної властивості умовної ймовірності, апостеріорний розподіл дасть:
Це рівняння, що показує взаємозв'язок між умовною ймовірністю та окремими подіями, відоме як теорема Баєса. Цей простий вираз містить у собі технічне ядро баєсового висновування, що має на меті конструювання уточненого переконання, , доречними та розв'язними способами.Шаблон:Sfn
Взаємозамінюваність
Звичною відправною точкою статистичного аналізу є припущення, що n значень є взаємозамінюваними. Якщо не доступно жодної інформації, крім даних y, щоби відрізняти будь-яке з від інших, і неможливо зробити жодного впорядкування чи групування параметрів, то необхідно виходити з симетричності серед параметрів у їхньому апріорному розподілі.[6] Цю симетрію ймовірнісно представлено взаємозамінюваністю. Загалом, маючи деякий невідомий вектор параметрів з розподілом , корисно та доречно моделювати дані зі взаємозамінюваного розподілу, як незалежно та однаково розподілені.
Скінченна взаємозамінюваність
Для незмінного числа n набір є взаємозамінюваним, якщо спільний розподіл є інваріантним відносно переставляння індексів. Тобто, для кожного переставлення або індексів (1, 2, …, n), Шаблон:Sfn
Наступний приклад є взаємозамінюваним, але не незалежним та однаково розподіленим (НОР): Розгляньмо глек із червоною та синьою кулями всередині, з імовірністю витягання кожної. Кулі витягують без повернення, тобто після витягування однієї кулі з n куль для наступного витягування там залишатиметься n − 1 куль.
Нехай якщо -та куля є червоною інакше.
Оскільки ймовірність обрання червоної кулі в першому витягуванні та синьої кулі у другому витягуванні дорівнює ймовірності обрання синьої кулі в першому витягуванні та червоної кулі в другому, обидві з яких дорівнюють 1/2 (тобто, ), то та є взаємозамінюваними.
Але ймовірністю обрання червоної кулі в другому витягуванні, коли червону кулю вже було обрано в першому, є 0, і вона не дорівнює ймовірності обрання червоної кулі в другому витягуванні, яка дорівнює 1/2 (тобто, ). Таким чином, та не є незалежними.
Якщо є незалежними та однаково розподіленими, то вони є взаємозамінюваними, але обернене є не обов'язково істинним.[7]
Нескінченна взаємозамінюваність
Нескінченна взаємозамінюваність — це така властивість, що кожна скінченна підмножина нескінченної послідовності , є взаємозамінюваною. Тобто, для будь-якого n послідовність є взаємозамінюваною.[7]
Ієрархічні моделі
Складові
Баєсове ієрархічне моделювання при виведенні апостеріорного розподілу використовує два важливі поняття,[1] а саме:
- Гіпермараметри: параметри апріорного розподілу
- Шаблон:Нпні: розподіли гіперпараметрів
Припустімо, що випадкова змінна Y слідує нормальному розподілові з параметром θ як середнє та 1 як дисперсія, тобто, . Припустімо також, що параметр має розподіл, заданий нормальним розподілом із середнім та дисперсією 1, тобто, . Більше того, слідує іншому заданому розподілові, наприклад, стандартному нормальному розподілові, . Параметр називають гіперпараметром, тоді як його розподіл, заданий як , є прикладом гіперапріорного розподілу. Запис розподілу Y змінюється із додаванням нового параметру, тобто, . Якщо є додатковий рівень, скажімо, слідує іншому нормальному розподілові з середнім та дисперсією , що означає , то та також може бути названо гіперпараметрами, тоді як їхні розподіли є також гіперапріорними розподілами.Шаблон:Sfn
Система
Нехай є спостереженням, а — параметром, що регулює процес породжування даних для . Припустімо далі, що параметри породжуються взаємозамінювано зі спільної генеральної сукупності, з розподілом, керованим гіперпараметром .
Ця баєсова ієрархічна модель містить наступні рівні:
- Рівень I:
- Рівень II:
- Рівень III:
Правдоподібністю, як видно на рівні I, є , з як її апріорним розподілом. Зауважте, що ця правдоподібність залежить від лише через .
Апріорний розподіл з рівня I може бути розбито як
- [з визначення умовної ймовірності]
з як його гіперпараметром з гіперапріорним розподілом .
Таким чином, апостеріорний розподіл є пропорційним до:
- [із застосуванням теореми Баєса]
- [8]
Приклад
Щоби додатково проілюструвати це, розгляньмо наступний приклад.
Вчитель хоче оцінити, наскільки добре учень виконав свій тест SAT. Щоби оцінити це, він використовує інформацію про бали цього учня в старшій школі, та його поточний середній бал (grade point average, GPA). Його поточний середній бал, позначуваний через , має правдоподібність, задану деякою функцією ймовірності з параметром , наприклад, . Цей параметр є оцінкою SAT учня. Оцінку SAT розглядають як зразок, що береться зі спільного розподілу генеральної сукупності, проіндексованого за іншим параметром , що є балом цього учня зі старшої школи.Шаблон:Sfn Тобто, . Крім того, гіперпараметр слідує своєму власному розподілові, заданому , гіперапріорному.
Щоби отримати розв'язок для оцінки SAT, маючи інформацію про GPA,
Для отримання розв'язку для апостеріорного розподілу буде використано всю інформацію в задачі. Замість розв'язування з використанням лише апріорного розподілу та функції правдоподібності, використання гіперапріорних дає більше інформації для отримування точніших переконань про поведінку параметра.[9]
Дворівнева ієрархічна модель
Загалом, спільним апостеріорним розподілом, що нас цікавить, у дворівневій ієрархічній моделі є:
Трирівнева ієрархічна модель
Для трирівневої ієрархічної моделі апостеріорний розподіл задається так:
Примітки
- ↑ 1,0 1,1 Allenby, Rossi, McCulloch (January 2005). "Hierarchical Bayes Model: A Practitioner’s Guide" Шаблон:Webarchive. Journal of Bayesian Applications in Marketing Шаблон:Webarchive, pp. 1–4. Retrieved 26 April 2014, p. 3 Шаблон:Ref-en
- ↑ Шаблон:Cite book Шаблон:Ref-en
- ↑ Good, I.J. (February 1980). “Some history of the hierarchical Bayesian methodology”Шаблон:Dead link. Trabajos de Estadistica Y de Investigacion Operativa Volume 31 Issue 1 Шаблон:Webarchive. Springer – Verlag, p. 480 Шаблон:Ref-es
- ↑ Good, I.J. (February 1980). “Some history of the hierarchical Bayesian methodology”Шаблон:Dead link. Trabajos de Estadistica Y de Investigacion Operativa Volume 31 Issue 1 Шаблон:Webarchive. Springer – Verlag, pp. 489–490 Шаблон:Ref-es
- ↑ Bernardo, Smith(1994). Bayesian Theory Шаблон:Webarchive. Chichester, England: John Wiley & Sons, Шаблон:ISBN, p. 23 Шаблон:Ref-en
- ↑ Bernardo, Degroot, Lindley (September 1983). “Proceedings of the Second Valencia International Meeting” Шаблон:Webarchive. Bayesian Statistics 2 Шаблон:Webarchive. Amsterdam: Elsevier Science Publishers B.V, Шаблон:ISBN, pp. 167–168 Шаблон:Ref-en
- ↑ 7,0 7,1 Diaconis, Freedman (1980). “Finite exchangeable sequences”. Annals of Probability, pp. 745–747 Шаблон:Ref-en
- ↑ Bernardo, Degroot, Lindley (September 1983). “Proceedings of the Second Valencia International Meeting” Шаблон:Webarchive. Bayesian Statistics 2 Шаблон:Webarchive. Amsterdam: Elsevier Science Publishers B.V, Шаблон:ISBN, pp. 371–372 Шаблон:Ref-en
- ↑ 9,0 9,1 9,2 Box G. E. P., Tiao G. C. (1965). "Multiparameter problem from a bayesian point of view". Multiparameter Problems From A Bayesian Point of View Volume 36 Number 5 Шаблон:Webarchive. New York City: John Wiley & Sons, Шаблон:ISBN Шаблон:Ref-en