Тест Грабса
У статистиці, тест Грабса (названий на честь Френка Е. Грабса, який опублікував тест у 1950 р.[1]), також відомий як максимальний нормалізований тест залишків або екстремальний стюдентізований тест відхилень є тестом, який використовується для виявлення викидів у одномірному наборі даних, який передбачається надходити з нормально розподіленої сукупності.
Визначення
Тест Грабса базується на припущенні нормальності . Тобто перед застосуванням тесту Грабса слід спочатку перевірити, чи дані можна розумно апроксимувати нормальним розподілом.[2]
Тест Грабса виявляє по одному викиду за раз. Цей викид видаляється з набору даних, і тест повторюється, поки не буде виявлено викидів. Однак багаторазові ітерації змінюють ймовірність виявлення, і тест не слід використовувати для вибірок розмірами в шість значень чи менше, оскільки він часто позначає більшість точок як викиди.[3]
Тест Грабса визначається для гіпотези :
- H0 : У наборі даних немає викидів
- Ha : У наборі даних є лише один викид
Статистичні дані тесту Грабса визначаються як:
де та що позначає середнє значення вибірки та стандартне відхилення відповідно. Статистика випробування Грабса — це найбільше абсолютне відхилення від середнього значення вибірки в одиницях стандартного відхилення вибірки.
Це двосторонній тест, для якого гіпотеза про відсутність викидів відкидається на рівні значущості α, якщо
де t α/(2 N), N −2, позначає верхнє критичне значення t-розподілу з N - 2 ступенями свободи та рівнем значущості α/(2 N).
Односторонній випадок
Тест Грабса можна також задати як односторонній тест, замінивши α/(2N) на α/N. Щоб перевірити, чи є мінімальне значення викидом, обчислюється значення статистики тесту :
де Y min, що позначає мінімальне значення. Щоб перевірити, чи є максимальне значення викидом, обчислюється значення статистики тесту:
де Y max позначає максимальне значення.
Споріднені методи
Для виявлення викидів можна і варто використовувати деякі графічні методи. Простий графік послідовності виконання, діаграма розмаху або гістограма повинні показувати будь-які очевидно віддалені точки. Графік нормального розподілу ймовірностей також може допомогти у вирішенні цієї задачі.
Див. також
Примітки
Додаткова література
- ↑ Шаблон:Cite journal
- ↑ Quoted from the Engineering and Statistics Handbook, paragraph 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm
- ↑ Шаблон:Cite journal