Достатня статистика

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

Достатня статистика для параметра θΘ, що визначає деяке сімейство Fθ розподілів ймовірності — статистика T=T(X), така, що умовна імовірність вибірки X=X1,X2,,Xn при даному значенні T(X) не залежить від параметра θ. Тобто виконується рівність:

(XX¯|T(X)=t,θ)=(XX¯|T(X)=t),

Достатня статистика T(X), таким чином містить у собі всю інформацію про параметр θ, що може бути одержана на основі вибірки X. Тому поняття достатньої статистики широко використовується в теорії оцінки параметрів.

Найпростішою достатньою статистикою є сама вибірка T(X)=X, проте справді важливими є випадки коли величина достатньої статистики значно менша від величини вибірки, зокрема коли достатня статистика виражається лише кількома числами.

Достатня статистика S=S(X) називається мінімальною достатньою, якщо для кожної достатньої статистики T існує невипадкова вимірна функція g, що S(X)=g(T(X)) майже напевно.

Теорема факторизації

Теорема факторизації дає спосіб практичного знаходження достатньої статистики для розподілу ймовірності. Вона дає достатні і необхідні умови достатності статистики і твердження теореми іноді використовується як означення.

Нехай T(X) — деяка статистика, а fθ(x) — умовна функція щільності чи функція ймовірностей (залежно від виду розподілу) для вектора спостережень X. Тоді T(X) є достатньою статистикою для параметра θΘ, якщо і тільки якщо існують такі вимірні функції h і g, що можна записати:

fθ(x)=h(x)g(θ,T(x))

Доведення

Нижче подано доведення для часткового випадку коли розподіл ймовірностей є дискретним. Тоді fθ(x)=(X=x|θ) — функція ймовірностей. Нехай дана функція має факторизацію, як у твердженні теореми і T(x)=t.

Тоді маємо:

(X=x|T(X)=t,θ)=(X=x|θ)(T(X)=t|θ)=h(x)g(θ,T(x))x:T(x)=th(x)g(θ,T(x))=h(x)g(θ,t)x:T(x)=th(x)g(θ,t)=h(x)x:T(x)=th(x).

Звідси бачимо, що умовна ймовірність вектора X при заданому значенні статистики T(X) не залежить від параметра і відповідно T(X) — достатня статистика.

Навпаки можемо записати:

(X=x|θ)=(X=x|T(X)=t,θ)(T(X)=t|θ).

З попереднього маємо, що перший множник правої сторони не залежить від параметра θ і його можна взяти за функцію h(x) з твердження теореми. Другий множник є функцією від θ і T(X), і його можна взяти за функцію g(θ,T(x)). Таким чином одержано необхідний розклад, що завершує доведення теореми.

Приклади

Розподіл Бернуллі

Нехай X1,X2,,Xn — послідовність випадкових величин, що рівні 1 з імовірністю p і рівні 0 з імовірністю 1 - p (тобто мають розподіл Бернуллі). Тоді

(x1,xn|p)=pxi(1p)nxi=pT(x)(1p)nT(x)

якщо взяти T(X)=X1++Xn.

Тоді дана статистика є достатньою згідно з теоремою факторизації, якщо позначити

g(p,T(x1,xn))=pT(x1,xn)(1p)nT(x1,xn)
h(x1,xn)=1

Розподіл Пуассона

Нехай X1,X2,,Xn — послідовність випадкових величин з розподілом Пуассона. Тоді

(x1,xn|λ)=eλλx1x1!eλλx2x2!eλλxnxn!=enλλ(x1+x2++xn)1x1!x2!xn!=enλλT(x)1x1!x2!xn!


де T(X)=X1++Xn.

Дана статистика є достатньою згідно з теоремою факторизації, якщо позначити

g(p,T(x1,xn))=enλλT(x)
h(x1,xn)=1x1!x2!xn!

Рівномірний розподіл

Нехай X1,X2,,Xn — послідовність рівномірно розподілених випадкових величин X1,X2,,XnU(a,b) . Для цього випадку

(x1,xn|λ)=(ba)n𝟏{amin1inXi}𝟏{max1inXib}.

Звідси випливає, що статистика T(X)=(min1inXi,max1inXi) є достатньою.

Нормальний розподіл

Для випадкових величин X1,X2,,Xn з нормальним розподілом 𝒩(μ,σ2) достатньою статистикою буде T(X)=(i=1nXi,i=1nXi2).

Властивості

  • Для достатньої статистики T та бієктивного відображення ϕ статистика ϕ(T) теж є достатньою.
  • Якщо δ(X) — статистична оцінка деякого параметра θ, T(X), — деяка достатня статистика і δ1(X)=E[δ(X)|T(X)] то δ1(X) є кращою оцінкою параметра в сенсі середньоквадратичного відхилення, тобто виконується нерівність
E[(δ1(X)ϑ)2]E[(δ(X)ϑ)2]
причому рівність досягається лише коли δ є вимірною функцією від T. (Теорема Рао — Блеквела)
  • З попереднього одержується, що оцінка може бути оптимальною в сенсі середньоквадратичного відхилення лише коли вона є вимірною функцією мінімальної достатньої статистики.
  • Якщо статистика T=T(X), є достатньою і повною (тобто з того, що Eθ[g(T(X))]=0,θΘ випливає, що Pθ(g(T(X))=0)=1θΘ), то довільна вимірна функція від неї є оптимальною оцінкою свого математичного сподівання.

Див. також

Джерела

Шаблон:Статистика