Бета-біноміальний розподіл

Матеріал з testwiki
Версія від 12:09, 5 листопада 2022, створена imported>Andriy.vBot (Бот: перекатегоризація з Сторінки із неперевіреними перекладами на Сторінки з неперевіреними перекладами)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Шаблон:Розподіл ймовірностей У теорії ймовірностей і статистиці, бета-біноміальний розподіл являє собою сімейство дискретних імовірнісних розподілів на скінченному носії невід'ємних цілих чисел, що виникає коли ймовірність успіху в кожному з фіксованих чи відомого числа випробувань Бернуллі або невідома, або є випадковою. Бета-біноміальний розподіл — це біноміальний розподіл, у якому ймовірність успіху в кожному з n випробувань не є фіксованою, а є випадковою реалізацією бета-розподіленої випадкової величини. Розподіл часто використовується в байєсівській статистиці, емпіричних методах Байєса та класичній статистиці для виявлення наддисперсії в біноміально розподілених даних.

Він зводиться до звичайного розподілу Бернуллі, коли n=1. Для α=β=1, це дискретний рівномірний розподіл від 0 до n. Він також як завгодно добре наближує біноміальний розподіл для великих α і β . Аналогічно, зводиться негативного біноміального розподілу при великими значеннями β і n. Бета-біноміальний є одновимірною версією мультиноміального розподілу Діріхле, оскільки біноміальний та бета-розподіл є одновимірними версіями мультиноміального та розподілу Діріхле відповідно.

Особливий випадок, коли α і β є цілими числами, також відомий як негативний гіпергеометричний розподіл.

Мотивація та виведення

Як складений розподіл

Бета-розподіл — це спряжений розподіл біноміального розподілу . Цей факт дозволяє аналітично вивести складений розподіл, якщо вважати параметр p у біноміальному розподілі як випадкову реалізацію бета-розподіленої випадкової величини. А саме, якщо

XBin(n,p)

тоді

P(X=kp,n)=L(pk)=(nk)pk(1p)nk

де Bin( n, p ) означає біноміальний розподіл, а де pвипадкова величина з бета-розподілом.

π(pα,β)=Beta(α,β)=pα1(1p)β1B(α,β)for 0p1,

тоді складений розподіл визначається як

f(kn,α,β)=01L(pk)π(pα,β)dp=(nk)1B(α,β)01pk+α1(1p)nk+β1dp=(nk)B(k+α,nk+β)B(α,β).

Використовуючи властивості бета-функції, вираз можна переписати

f(kn,α,β)=Γ(n+1)Γ(k+1)Γ(nk+1)Γ(k+α)Γ(nk+β)Γ(n+α+β)Γ(α+β)Γ(α)Γ(β).

Бета-біноміал як модель урни

Бета-біноміальний розподіл також можна пояснити за допомогою моделі урн для цілих додатних значень α і β, відомої як модель урни Полі. Зокрема, уявіть собі урну, що містить α червоних кульок та β чорних кульок, звідки їх виймають навмання. Якщо дістали червону кульку, то до урни повертають дві червоні кульки. Аналогічно з чорними кульками, якщо дістають чорну кулю, то натомість в урну повертають дві чорні. Якщо експеримент повторити n разів, то ймовірність отримати k червоних куль буде мати бета-біноміальний розподіл з параметрами n, α і β .

Якщо випадкові випробування здійснюються з простою заміною (повертають тільки одну, ту що щойно дістали, кульку), то маємо справу з біноміальним розподілом, а якщо експеримент здійснюються без заміни, то спостерігаємо реалізацію гіпергеометрично розподіленої випадкової величини.

Моменти та властивості

Перші три моменти

μ1=nαα+βμ2=nα[n(1+α)+β](α+β)(1+α+β)μ3=nα[n2(1+α)(2+α)+3n(1+α)β+β(βα)](α+β)(1+α+β)(2+α+β)

Ексцес задається формулою

β2=(α+β)2(1+α+β)nαβ(α+β+2)(α+β+3)(α+β+n)[(α+β)(α+β1+6n)+3αβ(n2)+6n23αβn(6n)α+β18αβn2(α+β)2].

Позначимо π=αα+β, тоді середнє можна записати як

μ=nαα+β=nπ

і дисперсія як

σ2=nαβ(α+β+n)(α+β)2(α+β+1)=nπ(1π)α+β+nα+β+1=nπ(1π)[1+(n1)ρ]

де ρ=1α+β+1. Параметр ρ відомий як кореляція «всередині класу» або «внутрішньокластерна» кореляція. Саме ця позитивна кореляція призводить до надмірної дисперсії.

Точкові оцінки

Метод моментів

Методом моментів можна отримати оцінки, а саме запишемо перший і другий моменти бета-біноміального розподілу

μ1=nαα+βμ2=nα[n(1+α)+β](α+β)(1+α+β)

і прирівняємо ці нецентральні моменти до першого та другого нецентрального моменту вибірки відповідно

μ^1:=m1=1Ni=1NXiμ^2:=m2=1Ni=1NXi2

розв’яжемо для α і β і отримуємо

α^=nm1m2n(m2m1m11)+m1β^=(nm1)(nm2m1)n(m2m1m11)+m1.

Ці оцінки можуть виглядати безглуздо негативними, що є доказом того, що дані є або нерозподілені зовсім або розподілені недостатньо у порівнянні до біноміального розподілу. У цьому випадку біноміальний розподіл і гіпергеометричний розподіл є альтернативними кандидатами відповідно.

Оцінка максимальної ймовірності

Хоч формула оцінки методом максимальної правдоподібності є непрактичною, враховуючи, що щільність складається із звичних функцій (гамма-функції та/або бета-функції), їх можна легко знайти за допомогою прямої чисельної оптимізації. Оцінки максимальної правдоподібності на основі емпіричних даних можуть бути обчислені за допомогою загальних методів підгонки мультиноміальних розподілів Полі, методи для яких описані в (Minka 2003). Пакет R VGAM через функцію vglm, використовуючи метод максимальної правдоподібності, полегшує оцінку УЛМ моделей з результатами, розподіленими за бета-біноміальним розподілом. Немає явної вимоги аби n було фіксованим впродовж спостережень.

Приклад

Наведені нижче дані показують кількість дітей чоловічої статі серед перших 12 дітей у 6115 сім'ях з 13-ма дітьми, взятих із лікарняних карт Саксонії 19 століття (Sokal and Rohlf, с.59 від Ліндсі). 13-ту дитину ігнорують, щоб пом’якшити ефект від того, що родина перестала пробувати завести дитину за умови досягнення бажаної статі.

Хлопчики 0 1 2 3 4 5 6 7 8 9 10 11 12
Родини 3 24 104 286 670 1033 1343 1112 829 478 181 45 7

Перші два емпіричні моменти

m1=6.23m2=42.31n=12

тому оцінка методом моментів

α^=34.1350β^=31.6085.

Оцінка методом максимальної ймовірності можна вирахувати чисельними методами

α^mle=34.09558β^mle=31.5715

і максимальна логарифмічна правдоподібність

log=12492.9

звідси знаходимо AIC

𝐴𝐼𝐶=24989.74.

AIC для конкуруючої біноміальної моделі є AIC = 25070.34, таким чином, бачимо, що бета-біноміальна модель забезпечує кращу відповідність даним, тобто присутні докази надмірної дисперсії. Трайверс і Віллард висувають теоретичне обгрунтування гетерогенності (також відомої як «розривність») у гендерній схильності нащадків ссавців (тобто надмірна дисперсність).

Краща припасовка особливо добре помітна в хвостах

Хлопці 0 1 2 3 4 5 6 7 8 9 10 11 12
Спостережувані родини 3 24 104 286 670 1033 1343 1112 829 478 181 45 7
Очікуваний число (бета-біноміальний) 2.3 22.6 104.8 310.9 655.7 1036.2 1257.9 1182.1 853.6 461.9 177,9 43.8 5.2
Очікуваний число ( біноміальний p = 0,519215) 0.9 12.1 71.8 258.5 628.1 1085.2 1367.3 1265.6 854.2 410,0 132.8 26.1 2.3

Подальші байєсівські міркування

Зручно перепараметризувати розподіли так, щоб очікуване середнє значення апріорного розподілу було одним параметром, нехай

π(θμ,M)=Beta(Mμ,M(1μ))=Γ(M)Γ(Mμ)Γ(M(1μ))θMμ1(1θ)M(1μ)1

де

μ=αα+βM=α+β

таким чином

E(θμ,M)=μVar(θμ,M)=μ(1μ)M+1.

Апостеріорний розподіл ρ ( θ | k ) також є бета-розподілом:

ρ(θk)(kθ)π(θμ,M)=Beta(k+Mμ,nk+M(1μ))=Γ(M)Γ(Mμ)Γ(M(1μ))(nk)θk+Mμ1(1θ)nk+M(1μ)1

І

E(θk)=k+Mμn+M.

тоді як граничний розподіл m ( k | μ, M ) визначається як

m(kμ,M)=01(kθ)π(θμ,M)dθ=Γ(M)Γ(Mμ)Γ(M(1μ))(nk)01θk+Mμ1(1θ)nk+M(1μ)1dθ=Γ(M)Γ(Mμ)Γ(M(1μ))(nk)Γ(k+Mμ)Γ(nk+M(1μ))Γ(n+M).

Підставляючи назад M і μ, в термінах α і β, отримаємо:

m(kα,β)=Γ(n+1)Γ(k+1)Γ(nk+1)Γ(k+α)Γ(nk+β)Γ(n+α+β)Γ(α+β)Γ(α)Γ(β).

який і є очікуваним бета-біноміальним розподілом з параметрами n,α і β .

Ми також можемо використати метод повторних матсподівань, щоб знайти очікуване значення граничних моментів. Запишемо нашу модель як двоступеневу модель складної вибірки. Нехай k i — кількість успіхів із n i спроб для події i :

kiBin(ni,θi)θiBeta(μ,M), i.i.d.

Можемо знайти покрокові оцінки моментів для середнього та дисперсії, використовуючи моменти для розподілів у двокроковій моделі:

E(kn)=E[E(kn|θ)]=E(θ)=μ
var(kn)=E[var(kn|θ)]+var[E(kn|θ)]=E[(1n)θ(1θ)|μ,M]+var(θμ,M)=1n(μ(1μ))+n1n(μ(1μ))M+1=μ(1μ)n(1+n1M+1).

(Тут ми використовували закон повного матсподівання і закон повної дисперсії.)

Знайдемо точкові оцінки μ і M . Розрахункове середнє μ^ розраховується з вибірки

μ^=i=1Nkii=1Nni.

Оцінку гіперпараметра M можна обчислити використовуючи оцінки моментів для дисперсії з двокрокової моделі:

s2=1Ni=1Nvar(kini)=1Ni=1Nμ^(1μ^)ni[1+ni1M^+1]

І розв'яжемо для М:

M^=μ^(1μ^)s2s2μ^(1μ^)Ni=1N1/ni,

де

s2=Ni=1Nni(θi^μ^)2(N1)i=1Nni.

Оскільки тепер ми маємо оцінки параметрів, μ^ і M^, для основного розподілу можемо знайти точкову оцінку θ~i для ймовірності успіху події i . Її можна обчислити як середнє зважене значення оцінки події θi^=ki/ni і μ^ . Враховуючи наші точкові оцінки для апріора, можна підставити їхні значення, щоб знайти точкову оцінку для апостеріору

θi~=E(θki)=ki+M^μ^ni+M^=M^ni+M^μ^+nini+M^kini.

Фактори усадки

Можемо записати апостеріорну оцінку як середньозважене:

θ~i=B^iμ^+(1B^i)θ^i

де B^i називається коефіцієнтом усадки .

Bi^=M^M^+ni

Пов'язані розподіли

Див. також

  • Мультиноміальний розподіл Діріхле

Посилання

Зовнішні посилання

Шаблон:Список розподілів ймовірності