Леді дегустує чай
Леді дегустує чай — відомий рандомізований експеримент з визначення статистичної значущості для перевірки нульової гіпотези, проведений англійським вченим Рональдом Фішером.
Експеримент був описаний у книзі Фішера Шаблон:Нп, на його основі було запропоновано точний тест Фішера.
Історія
Традиційний англійський чай можна приготувати двома способами: спочатку налити у чашку молоко, а потім чай; або навпаки, спочатку чай, а потім молоко. У 1946 році в есе «Гарна чашка чаю» Джордж Орвелл стверджував, що «чай є основою цивілізації у нашій країні, однак процес його приготування породжує надзвичайно багато суперечок»[1]. Питання черговості наливання молока та чаю настільки поділило громадську думку, що «у кожній сім'ї можуть знайтись прихильники обох сторін».
Знайома Рональда Фішера, психолог Муріель Брістоль (Шаблон:Lang-en), якось сказала, що може відрізнити напої, приготовані різними способами. Для перевірки цього твердження Фішер організував експеримент, у ході якого леді мала відгадати спосіб приготування восьми чашок чаю (по чотири на кожний спосіб), поданих у випадковому порядку. У ході дегустування Брістоль змогла правильно класифікувати усі чашки.
Експеримент
Нульовою гіпотезою для даного експерименту було твердження, що всі чашки мають однаковий смак і спосіб приготування визначити неможливо.
Для експерименту приготували вісім чашок: у чотирьох випадках спочатку наливали чай, а потім молоко, у інших чотирьох навпаки. Чашки подавались у випадковому порядку. Леді мала вибрати з запропонованих чашок чотири таких, які були приготовані способом «спершу молоко». При цьому вона мала можливість порівнювати чашки одна з одною, а також їй були відомі інші умови експерименту.
Статистичним критерієм була кількість успішних визначень у наборі з чотирьох чашок. Кількість можливих варіантів при та розраховується наступним чином:
За умов, що нульова гіпотеза є вірною, варіанти розподіляються так:
| Кількість вірних визначень | Можливі комбінації | Кількість комбінацій |
|---|---|---|
| 0 | oooo | 1 × 1 = 1 |
| 1 | ooox, ooxo, oxoo, xooo | 4 × 4 = 16 |
| 2 | ooxx, oxox, oxxo, xoxo, xxoo, xoox | 6 × 6 = 36 |
| 3 | oxxx, xoxx, xxox, xxxo | 4 × 4 = 16 |
| 4 | xxxx | 1 × 1 = 1 |
| Всього | 70 | |
Кількості варіантів розподіляються так:
- Очевидно, існує один варіант, коли всі відібрані чашки будуть хибними
- Розглянемо випадок, коли лише з чотирьох відібраних чашок буде вгадана вірно, а інші три будуть хибними. Тут є способи обрати єдину вірну чашку, а також способи обрати три з чотирьох невірних варіантів. Загальна кількість варіантів становить 4×4 = 16.
Рівень значущості встановили у 5 %. Таким чином, імовірність вибору усіх чотирьох правильних варіантів була нижче рівня значущості (100%*1/70≈ 1.4 % < 5 %), а імовірність вибору з однократною помилкою знаходилась вище (16+1)/70 (≈ 24.3 % > 5 %).
Таким чином було показано, що нульова гіпотеза спростовувалась би тоді і лише тоді, коли леді зможе правильно визначити усі чотири чашки для набору.
Використання точного тесту Фішера
Для випадку, коли леді правильно визначає одну з чотирьох вибраних чашок, можна побудувати наступну таблицю спряженості[2]:
| Спершу молоко | Спершу чай | Всього | |
|---|---|---|---|
| Правильно вгадано «спершу молоко» | a=3 | b=1 | a+b=4 |
| Правильно вгадано «спершу чай» | c=1 | d=3 | c+d=4 |
| всього | a+c=4 | b+d=4 | n=8 |
Імовірність даного випадку розраховується за формулою:
Тобто
Принципи
Окрім математичного обгрунтування, Фішер також заклав основні принципи проведення подібних експериментів[3]:
- Порівняння — має бути можливість чіткого розрізнення варіантів. У даному випадку ті, хто готував експеримент, точно знали, яку чашку яким способом було приготовано.
- Рандомізація — найважливіша особливість експерименту полягала в тому, що чашки подавались у випадковому порядку
- Реплікація — для збільшення точності експерименту його слід повторити кілька разів (леді мала робити вибір 8 разів)
- Замінність — усі варіанти вибору (чашки) мають бути схожими один з одним, за винятком того фактору, який їх відрізняє.
- Блокування — якщо у експерименті присутні інші фактори, дослідник має відокремити їх. Наприклад, якби тут було два сорти чаю, правильніше було б зробити серію виборів для кожного сорту окремо.
Примітки
- ↑ George Orwell, Ian Angus, Sheila Davison (1998). The Complete Works of George Orwell: Smothered under journalism, 1946. p. 34. Secker & Warburg
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web