Розподіл Діріхле

Матеріал з testwiki
Версія від 09:32, 5 травня 2024, створена imported>Klip game (top: clean up, replaced: вірогідн → імовірн за допомогою AWB)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Шаблон:Розподіл ймовірностей У теорії імовірностей і математичній статистиці розподіл Діріхле (за іменем Йоганна Петера Густава Лежьона-Діріхле), позначають часто Dir(α) — це сімейство безупинних багатовимірних імовірних розподілів невід’ємних дійсних чисел, параметризованих вектором α. Розподіл Діріхле є узагальненням Бета-розподілу на багатовимірний випадок. Тобто, його функція щільності повертає значення імовірності того, що імовірність кожного з K взаємновиключних подій дорівнює xi за умови, що кожна подія спостерігалася αi1 раз.

Функція щільності імовірності

Функція щільності імовірності для розподілу Діріхле порядку K має вигляд:

f(x1,,xK;α1,,αK)=1B(α)i=1Kxiαi1

де xi0, i=1Kxi=1, i αi0.

Властивості

Нехай X=(X1,,XK)Dir(α) i α0=i=1Kαi, тоді

E[Xi|α]=αiα0,
Var[Xi|α]=αi(α0αi)α02(α0+1),
Cov[XiXj|α]=αiαjα02(α0+1).

Модою розподілу є вектор X=(X1,X2,,XK) з

xi=αi1α0K,αi>1.

Розподіл Діріхле є сполученим апріорним розподілом до мультиноміального розподілу, а саме: якщо

β|X=(β1,,βK)|XMult(X),

де βi - число входжень і у вибірку з n точок дискретного розподілу на {1, ..., K}, визначеного через X, то

X|βDir(α+β).

Цей зв'язок використовується в Байєсівській статистиці для того, щоб оцінити приховані параметри дискретного імовірносного розподілу X, маючи набір з n вибірок. Очевидно, якщо апріорний розподіл позначений як Dir(α), то Dir(α+β) - це апостеріорний розподіл після серії спостережень з гістограмою β.

Зв'язок з іншими розподілами

Якщо для i{1,2,,K},

YiGamma(shape=αi,scale=1) незалежні, то
V=i=1KYiGamma(shape=i=1Kαi,scale=1),

і

(X1,,XK)=(Y1/V,,YK/V)Dir(α1,,αK).

Попри те, що Xі не є незалежними один від одного, вони можуть бути згенерованні з набору з K незалежних гама випадкових величин. Однак, тому що сума V губиться в процесі формування X=(X1,X2,,XK), стає неможливо відновити початкові значення гамма-випадкових величин тільки за цими значеннями. Проте, завдяки тому, що працювати з незалежними випадковими величинами простіше, це перетворення параметрів може бути корисно при доведенні властивостей розподілу Діріхле.

Генерація випадкових чисел

Метод побудови випадкового вектора x=(x1,,xK) для розподілу Діріхле розмірності K з параметрами (α1,,αK) випливає безпосередньо з цього зв'язку. Спочатку одержимо K незалежних випадкових вибірок y1,,yK з гамма-розподілів, кожен з який має щільність

yiαi1eyiΓ(αi),

а потім покладемо

xi=yi/j=1Kyj.


Наочне трактування параметрів

Як приклад використання розподілу Діріхле можна запропонувати задачу, у якій потрібно розрізати нитки (кожна початкової довжини 1.0) на K частин з різними довжинами так, щоб усі частини мали задану середню довжину, але з можливістю деякої варіації відносних довжин частин. Значення α/α0 визначають середні довжини частин нитки, що вийшли з розподілу. Дисперсія навколо середнього значення зворотньо пропорційна α0.

Ланки

Шаблон:Розподіли ймовірності