Нерівність Чебишова

Матеріал з testwiki
Версія від 16:38, 13 серпня 2022, створена imported>Олюсь
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку
Для нерівності для наборів чисел — див. Нерівність Чебишова для сум чисел.

Нерівність Чебишова — результат теорії ймовірностей, який стверджує, що для будь-якої випадкової величини із скінченною дисперсією майже всі значення концентруються біля значення математичного сподівання. Нерівність Чебишева дає кількісні характеристики цієї властивості.

Теорема

Нехай X є випадковою величиною із математичним сподіванням η і дисперсією σ2. Тоді для всякого ϵ>0 виконується нерівність:

P{|Xη|ϵ}σ2ϵ2

інакше

P{|Xη|kσ}1k2

Нам цікавий лише випадок з k>1. Коли k1 права частина 1k21 і нерівність стає тривіальною, бо ймовірність не перевищує 1.

Наприклад, використовуючи k=2 показуємо, що ймовірність того., що значення лежить поза проміжком (μ2σ,μ+2σ) не перевищує 12.

Тому що нерівність можна застосувати до будь-яких розподілів якщо вони мають відоме середнє значення і дисперсію, нерівність зазвичай дає слабку оцінку в порівнянні з ситуацією коли відомо більше даних про розподіл.

k Мін. % в k стандартнихШаблон:Ns
відхилень від середнього
Макс. % поза k стандартнихШаблон:Ns
відхилень від середнього
1 0% 100%
Шаблон:Sqrt 50% 50%
1.5 55.56% 44.44%
2 75% 25%
3 88.8889% 11.1111%
4 93.75% 6.25%
5 96% 4%
6 97.2222% 2.7778%
7 97.9592% 2.0408%
8 98.4375% 1.5625%
9 98.7654% 1.2346%
10 99% 1%

Приклад

Припустімо, що ми навмання обираємо часописну статтю зі джерела з 1000 слів на статтю в середньому, зі стандартним відхиленням у 200 слів. Ми можемо зробити висновок, що ймовірність того, що стаття містить від 600 до 1400 слів (тобто в межах k = 2 стандартних відхилень від середнього) має бути щонайменше 75%, бо згідно з нерівністю Чебишова шанс опинитись за межами цього діапазону не більший ніж Шаблон:Frac = Шаблон:Frac2}}. Але, якби ми додатково знали, що ми маємо справу з нормальним розподілом, ми могли б сказати, що існує 75% шанс того, що кількість слів між 770 і 1230 (точніше обмеження).

Точність оцінки

Як показано вище, нерівність зазвичай надає радше слабку оцінку. Однак, для довільного розподілу її неможливо покращити. Це точна оцінка для такого розподілу: для будь-якого k ≥ 1,

X={1,з імовірністю 12k20,з імовірністю 11k21,з імовірністю 12k2

Для цього прикладу, середнє значення μ = 0 і стандартне відхилення σ = 1/k, отже

Pr(|Xμ|kσ)=Pr(|X|1)=1k2.

саме для розподілів, які є лінійними перетвореннями цього прикладу, нерівність Чебишева стає рівністю.

Доведення

Шаблон:Розділ без джерел Нехай F(x)  - функція розподілу змінної X. Тоді:

P{|Xη|ϵ}=ηϵdF(x)+η+ϵdF(x)=|xη|ϵdF(x)

Звідси одержуємо,

σ2=(xη)2dF(x)|xη|ϵ(xη)2dF(x)ϵ2|xη|ϵdF(x)

З того, що P{|Xη|ϵ}=|xη|ϵdF(x) одержуємо твердження теореми.

Див. також

Джерела