Статистика Петуніна

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

Шаблон:Експерт Статистика Петуніна (p-статистика) — міра близькості між вибірками, запропонована українським математиком Юрій Петуніним. Використовується для перевірки гіпотези про рівність функцій розподілу двох вибірок.

Розглянемо дві генеральні сукупності G та G та відповідні функції розподілу FG та FG. Нехай x=(x1,x2,...,xn)G та x=(x1,x2,...,xm)G, а x(1)x(2)...x(n) та x(1)x(2)...x(m) — відповідні порядкові статистики. Припустимо, що FG(u)=FG(u), тоді

p(Aij)=P(xk(x(i),x(j)))=pij=jin+1.

Якщо маємо вибірку x(x(1),x(2),...,x(m)), можемо знайти частоту hij випадкові події Aij та довірчі інтервали (pij(1),pij(2)) для ймовірності pij при заданому рівні значущості β, тобто B={pij(pij(1),pij(2))},p(B)=1β. Згідно з [1]

pij(1)=hijm+g22ghij(1hij)m+g24m+g2

pij(2)=hijm+g22+ghij(1hij)m+g24m+g2

,

де g задовольняє умову ϕ(g)=1β2 (ϕ(g) — щільність нормального розподілу). Згідно з [2] покладемо g=3.

Позначимо через N всі довірчі інтервали Iij=(pij(1),pij(2)) (N=n(n1)2) та L — число інтервалів Iij, які містять ймовірність pij, тобто pijIij. Покладемо

h=ρ(x,x)=LN

Статистика h називається p-статистикою (статистикою Петуніна), вона є мірою близькості ρ(x,x) між вибірками x та x.

Примітки

Шаблон:Reflist

Джерела

  • Клюшин Д. А., Петунин Ю. И. Непараметрический критерий эквивалентности генеральных совокупностей, основанный на мере близости между выборками // Український математичний журнал. — 2003. — т.55, № 2. — С.147-163. Шаблон:Ref-ru
  1. . Van der Waerden B.L. Mathematische Statistic. — Springer-Verlag, Berlin, 1957; English. transl. of 2nd (1965) ed. Springer-Verlag, Berlin and New York, 1969
  2. Петунін Ю. І., Клюшин Д. А., Ганіна К. П., Бородай Н. В., Андрушків Р. І. Комп'ютерна діагностика раку молочної залози // Вісник Київського університету. Сер. кібернетика. — 2001. —- Вип. 2. — С. 58-68.