Тест Грабса

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

У статистиці, тест Грабса (названий на честь Френка Е. Грабса, який опублікував тест у 1950 р.[1]), також відомий як максимальний нормалізований тест залишків або екстремальний стюдентізований тест відхилень є тестом, який використовується для виявлення викидів у одномірному наборі даних, який передбачається надходити з нормально розподіленої сукупності.

Визначення

Тест Грабса базується на припущенні нормальності . Тобто перед застосуванням тесту Грабса слід спочатку перевірити, чи дані можна розумно апроксимувати нормальним розподілом.[2]

Тест Грабса виявляє по одному викиду за раз. Цей викид видаляється з набору даних, і тест повторюється, поки не буде виявлено викидів. Однак багаторазові ітерації змінюють ймовірність виявлення, і тест не слід використовувати для вибірок розмірами в шість значень чи менше, оскільки він часто позначає більшість точок як викиди.[3]

Тест Грабса визначається для гіпотези :

H0 : У наборі даних немає викидів
Ha : У наборі даних є лише один викид

Статистичні дані тесту Грабса визначаються як:

G=maxi=1,,N|YiY¯|s

де Y та s що позначає середнє значення вибірки та стандартне відхилення відповідно. Статистика випробування Грабса — це найбільше абсолютне відхилення від середнього значення вибірки в одиницях стандартного відхилення вибірки.

Це двосторонній тест, для якого гіпотеза про відсутність викидів відкидається на рівні значущості α, якщо

G>N1Ntα/(2N),N22N2+tα/(2N),N22

де t α/(2 N), N −2, позначає верхнє критичне значення t-розподілу з N - 2 ступенями свободи та рівнем значущості α/(2 N).

Односторонній випадок

Тест Грабса можна також задати як односторонній тест, замінивши α/(2N) на α/N. Щоб перевірити, чи є мінімальне значення викидом, обчислюється значення статистики тесту :

G=Y¯Ymins

де Y min, що позначає мінімальне значення. Щоб перевірити, чи є максимальне значення викидом, обчислюється значення статистики тесту:

G=YmaxY¯s

де Y max позначає максимальне значення.

Споріднені методи

Для виявлення викидів можна і варто використовувати деякі графічні методи. Простий графік послідовності виконання, діаграма розмаху або гістограма повинні показувати будь-які очевидно віддалені точки. Графік нормального розподілу ймовірностей також може допомогти у вирішенні цієї задачі.

Див. також

Примітки

Шаблон:Reflist

Додаткова література