Середньоквадратична похибка

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

Шаблон:Перенаправлено-не-плутати У статистиці середньоквадрати́чна по́хибка, сере́дня квадрати́чна по́хибка (СКП, Шаблон:Lang-en)[1][2] або середньоквадрати́чне відхи́лення, сере́днє квадрати́чне відхи́лення (СКВ, Шаблон:Lang-en) оцінювача (процедури оцінювання неспостережуваної величини) вимірює усереднення квадратів похибок — тобто, середнє квадратичної різниці між оцінками значень та справжнім значенням. СКП є функцією ризику, яка відповідає математичному сподіванню квадрату похибкових втрат.Шаблон:На чию думкуШаблон:Прояснити Той факт, що СКП є майже завжди строго додатною (а не нульовою), випливає з випадковості, або з того, що оцінювач Шаблон:Нп, яка могла би давати точнішу оцінку.[3]

СКП є мірою якості оцінювача. Оскільки вона походить від квадрата евклідової відстані, її значення є завжди додатним, і зменшується, коли похибка наближається до нуля.

СКП є другим моментом похибки (відносно оригіналу),Шаблон:Прояснити і, таким чином, охоплює як дисперсію оцінювача (наскільки широким є розкид оцінок від одного зразка даних до іншого), так і його зміщення (наскільки віддаленим є усереднене оцінене значення від істинного).Шаблон:Джерело Для незміщеного оцінювача СКП є його дисперсією. Як і дисперсія, СКП має ті ж одиниці вимірювання, що й квадрат оцінюваної величини. За аналогією зі стандартним відхиленням, взяття квадратного кореня СКП дає кореневу середньоквадратичну похибку, або Шаблон:Нп (КСКП або КСКВ, Шаблон:Lang-en), що має ті ж одиниці вимірювання, що й оцінювана величина. Для незміщеного оцінювача КСКП є квадратним коренем дисперсії, відомим як стандартна похибка.

Визначення та основні властивості

СКП оцінює якість або передбачувача (тобто функції, що відображує довільні входи до вибірки значень деякої випадкової величини), або оцінювача (тобто математичної функції, що відображує вибірку даних до оцінки параметра сукупності, з якої відбираються ці дані). Визначення СКП різниться залежно від того, чи вона описує передбачувач, чи оцінювач.

Передбачувач

Якщо вектор з n передбачень породжується з вибірки n точок даних на всіх змінних, Y є вектором спостережуваних значень передбачуваної змінної, а Y^ є передбаченими значеннями (наприклад, як із допасовування найменшими квадратами), тоді СКП цього передбачувача в межах цієї вибірки обчислюється як

MSE=1ni=1n(YiYi^)2.

Іншими словами, СКП є середнім значенням (1ni=1n) квадратів похибок (YiYi^)2. Це є легко обчислюваною величиною для конкретної вибірки (й отже, залежить від вибірки).

У матрицевому записі

MSE=1ni=1n(ei)2=1n𝐞𝖳𝐞

де ei є (YiYi^), а 𝐞 є матрицею n×1.

СКП також можливо обчислювати на q точках даних, які не використовували для оцінювання моделі, чи то через те, що їх було притримано для цієї мети, чи то через те, що ці дані було отримано щойно. У цьому процесі (відомому як перехресне затверджування) СКП часто називають Шаблон:НпШаблон:Джерело, й обчислюють як

MSPE=1qi=n+1n+q(YiYi^)2.

Оцінювач

СКП оцінювача θ^ відносно невідомого параметра θ визначають як[2]

MSE(θ^)=Eθ[(θ^θ)2].

Це визначення залежить від невідомого параметра, але СКП апріорі є властивістю оцінювача. СКП може бути функцією від невідомих параметрів, і в цьому випадку будь-який оцінювач СКП на основі оцінок цих параметрів буде функцією від даних (і відтак випадковою величиною). Якщо оцінювач θ^ виводять як статистику вибірки й використовують для оцінювання якогось параметра сукупності, тоді математичне сподівання стосується ви́біркового розподілу цієї статистики вибірки.

СКП можливо записувати як суму дисперсії оцінювача та квадрату його зміщення, що забезпечує корисний спосіб обчислювання СКП й виражає те, що у випадку незміщених оцінювачів СКП та дисперсія дорівнюють одна одній.[4]

MSE(θ^)=Varθ(θ^)+Bias(θ^,θ)2.

Доведення взаємозв'язку з дисперсією та зміщенням

MSE(θ^)=Eθ[(θ^θ)2]=Eθ[(θ^Eθ[θ^]+Eθ[θ^]θ)2]=Eθ[(θ^Eθ[θ^])2+2(θ^Eθ[θ^])(Eθ[θ^]θ)+(Eθ[θ^]θ)2]=Eθ[(θ^Eθ[θ^])2]+Eθ[2(θ^Eθ[θ^])(Eθ[θ^]θ)]+Eθ[(Eθ[θ^]θ)2]=Eθ[(θ^Eθ[θ^])2]+2(Eθ[θ^]θ)Eθ[θ^Eθ[θ^]]+(Eθ[θ^]θ)2Eθ[θ^]θ=const.=Eθ[(θ^Eθ[θ^])2]+2(Eθ[θ^]θ)(Eθ[θ^]Eθ[θ^])+(Eθ[θ^]θ)2Eθ[θ^]=const.=Eθ[(θ^Eθ[θ^])2]+(Eθ[θ^]θ)2=Varθ(θ^)+Biasθ(θ^,θ)2

Як альтернативний варіант, маємо

𝔼(θθ^)2=𝔼(θ^2)+𝔼(θ2)2θ𝔼(θ^)=Var(θ^)+(𝔼θ^)2+θ22θ𝔼(θ^)=Var(θ^)+(𝔼θ^θ)2=Var(θ^)+Bias2(θ^)

Але у випадку реального моделювання, СКП можливо описувати як суму дисперсії моделі, зміщення моделі, та незвідної невизначеностіШаблон:ДжерелоШаблон:Прояснити. Відповідно до цього взаємозв'язку, СКП оцінювачів можливо просто використовувати для порівнювання Шаблон:Нп, що враховує інформацію про дисперсію та зміщення оцінювача. Це називають критерієм СКП (Шаблон:Lang-en).

У регресії

Шаблон:Докладніше1

В регресійному аналізі природнішим способом перегляду загальної тенденції даних у цілому є побудова графіків. Середнє значення відстані від кожної з точок до передбачуваної регресійної моделі можливо обчислювати й показувати як середньоквадратичну похибку. Піднесення до квадрату має вирішальне значення для подолання складності з від'ємними знаками. Для мінімізування СКП модель може бути точнішою, що означатиме, що модель є ближчою до фактичних даних. Одним із прикладів лінійної регресії з використанням цього методу є метод найменших квадратів, який оцінює адекватність моделі лінійної регресії для моделювання Шаблон:Нп,[5] але обмеження якого пов'язане з відомим розподілом цих даних.

Термін середньоквадратична похибка іноді використовують як позначення незміщеної оцінки дисперсії похибок: Шаблон:Нп, поділеної на кількість ступенів вільності. Це визначення для відомої, обчислюваної величини відрізняється від наведеного вище визначення для обчислюваної СКП передбачувача використанням іншого знаменника. Цим знаменником є розмір вибірки, зменшений на кількість параметрів моделі, оцінюваних з тих самих даних, (n − p) для p регресорів, або (n − p − 1), якщо використовують Шаблон:Нп (докладніше див. похибки та залишки у статистиці).[6] Незважаючи на те, що СКП (визначене як у цій статті) не є незміщеним оцінювачем дисперсії похибок, вона є слушним оцінювачем за умови слушності передбачувача.

У регресійнім аналізі «середньоквадратична похибка», яку часто називають Шаблон:Нп або «позави́бірковою середньоквадратичною похибкою» (Шаблон:Lang-en), може також позначувати середнє значення Шаблон:Нп передбачень від істинних значень на позавибірковому випробувальному просторі, породженому моделлю, оціненою за певним ви́бірковим простором. Вона також є відомою, обчислюваною величиною, і вона різниться залежно від вибірки та позавибіркового випробувального простору.

Приклади

Середнє значення

Нехай є випадкова вибірка розміру n з генеральної сукупності, X1,,Xn. Нехай зразки вибірки було вибрано Шаблон:Нп. Тобто, n зразків вибирають по одному, і раніше вибрані зразки все одно мають право бути вибраними для всіх n витягувань. Звичайним оцінювачем для μ є ви́біркове середнє[1]

X=1ni=1nXi

яке має математичне сподівання, що дорівнює істинному середньому μ (тож воно є незміщеним), і середньоквадратичну похибку

MSE(X)=E[(Xμ)2]=(σn)2=σ2n

де σ2 є дисперсією сукупності.

Це є Шаблон:Нп (тобто тим, що має найнижчу СКП серед усіх незміщених оцінювачів) для гауссового розподілу, але не для, скажімо, рівномірного розподілу.

Дисперсія

Шаблон:Further

Звичайним оцінювачем дисперсії є виправлена дисперсія вибірки:

Sn12=1n1i=1n(XiX)2=1n1(i=1nXi2nX2).

Він є незміщеним (його математичним сподіванням є σ2), й відтак його також називають незміщеною дисперсією вибірки, а його СКП становить[7]

MSE(Sn12)=1n(μ4n3n1σ4)=1n(γ2+2nn1)σ4,

де μ4 є четвертим центральним моментом розподілу або сукупності, а γ2=μ4/σ43 є коефіцієнтом ексцесу.

Проте можливо використовувати й інші оцінювачі для σ2, пропорційні Sn12, і належний вибір може завжди давати нижчу середньоквадратичну похибку. Якщо ми визначимо

Sa2=n1aSn12=1ai=1n(XiX)2

тоді обчислюємо:

MSE(Sa2)=E[(n1aSn12σ2)2]=E[(n1)2a2Sn142(n1aSn12)σ2+σ4]=(n1)2a2E[Sn14]2(n1a)E[Sn12]σ2+σ4=(n1)2a2E[Sn14]2(n1a)σ4+σ4E[Sn12]=σ2=(n1)2a2(γ2n+n+1n1)σ42(n1a)σ4+σ4E[Sn14]=MSE(Sn12)+σ4=n1na2((n1)γ2+n2+n)σ42(n1a)σ4+σ4

Це мінімізується, коли

a=(n1)γ2+n2+nn=n+1+n1nγ2.

Для гауссового розподілу, де γ2=0, це означає, що СКП зводиться до мінімуму при діленні суми на a=n+1 . Мінімальний коефіцієнт ексцесу становить γ2=2,Шаблон:Efn що досягається розподілом Бернуллі з p = 1/2 (підкидання монети), й СКП зводиться до мінімуму при a=n1+2n. Отже, незалежно від коефіцієнту ексцесу, ми отримуємо «кращу» оцінку (в сенсі нижчої СКП), трохи зменшивши незміщений оцінювач. Це є простим прикладом Шаблон:Нп: оцінювач «стискають» у бік нуля (зменшують незміщений оцінювач).

Далі, хоч виправлена дисперсія вибірки і є Шаблон:Нп (мінімальна середньоквадратична похибка серед незміщених оцінювачів) дисперсії для гауссових розподілів, якщо розподіл не є гауссовим, то навіть серед незміщених оцінювачів Sn12 найкращим незміщеним оцінювачем дисперсії бути не може.

Гауссів розподіл

В наступній таблиці наведено декілька оцінювачів істинних параметрів сукупності, μ та σ2, для гауссового випадку.[8]

Істинне значення Оцінювач Середньоквадратична похибка
θ=μ θ^ = незміщений оцінювач середнього значення сукупності, X=1ni=1n(Xi) MSE(X)=E((Xμ)2)=(σn)2
θ=σ2 θ^ = незміщений оцінювач дисперсії сукупності, Sn12=1n1i=1n(XiX)2 MSE(Sn12)=E((Sn12σ2)2)=2n1σ4
θ=σ2 θ^ = зміщений оцінювач дисперсії сукупності, Sn2=1ni=1n(XiX)2 MSE(Sn2)=E((Sn2σ2)2)=2n1n2σ4
θ=σ2 θ^ = зміщений оцінювач дисперсії сукупності, Sn+12=1n+1i=1n(XiX)2 MSE(Sn+12)=E((Sn+12σ2)2)=2n+1σ4

Інтерпретація

Нульова СКП, що означає, що оцінювач θ^ передбачує спостереження параметру θ з бездоганною точністю, є ідеальною (але зазвичай неможливою).

Значення СКП можна використовувати з метою порівнювання. Дві або більше статистичних моделей можна порівнювати, використовуючи їхні СКП — як міру того, наскільки добре вони пояснюють заданий набір спостережень: незміщений оцінювач (оцінений зі статистичної моделі) з найменшою дисперсією серед усіх незміщених оцінювачів є Шаблон:Нп, або Шаблон:Lang-en.

Як методика лінійної регресії, так і методика дисперсійного аналізу оцінюють СКП як частину аналізу й використовують оцінену СКП, щоби визначати статистичну значущість досліджуваних чинників або предикторів. Метою планування експериментів є побудова експериментів таким чином, щоби при аналізі спостережень СКП була близькою до нуля відносно величини щонайменше одного з оцінюваних впливів експерименту.

В однофакторнім дисперсійнім аналізі СКП можливо обчислювати шляхом ділення суми квадратів похибок на ступінь вільності. Також, F-значення є відношенням середньоквадратичного впливу до СКП.

СКП також використовують у декількох методиках Шаблон:Нп як частину визначання того, скільки предикторів з набору кандидатів включити до моделі для заданого набору спостережень.

Застосування

Шаблон:Проза

  • Зведення СКП до мінімуму є ключовим критерієм обирання оцінювачів, див. Шаблон:Нп. Серед незміщених оцінювачів зведення СКП до мінімуму еквівалентне зведенню до мінімуму дисперсії, а оцінювач, який робить це, є Шаблон:Нп. Проте зміщений оцінювач може мати нижчу СКП, див. зміщення оцінювача.
  • У статистичному моделюванні СКП може подавати різницю між фактичними спостереженнями та значеннями спостережень, передбаченими моделлю. У цьому контексті її використовують для того, щоб визначати, наскільки модель допасовано до даних, а також чи можливо вилучити деякі пояснювальні змінні без значної шкоди для передбачувальної здатності моделі.
  • Шаблон:Нп у прогнозуванні та передбачуванні є мірою Шаблон:Нп, що ґрунтується на СКП.

Функція втрат

Втрати квадрату похибки є однією з найширше використовуваних функцій втрат у статистиціШаблон:Джерело, хоча її широке використання більше випливає з математичної зручності, ніж з міркувань фактичних втрат у застосуваннях. Карл Фрідріх Гаусс, який запровадив використання середньоквадратичної похибки, усвідомлював її довільність і погоджувався з запереченнями проти неї на цих підставах.[3] Математичні переваги середньоквадратичної похибки особливо очевидні при її використанні для аналізу продуктивності лінійної регресії, оскільки це дозволяє розділити дисперсію в наборі даних на дисперсію, що пояснюється моделлю, та дисперсію, що пояснюється випадковістю.

Критика

Беззаперечне використання середньоквадратичної похибки критикував фахівець із теорії рішень Шаблон:Нп. Середньоквадратична похибка — це мінус математичного сподівання однієї конкретної функції корисності, квадратичної, яка може не бути слушною функцією корисності для використання за заданої сукупності обставин. Проте існують деякі сценарії, за яких середньоквадратична похибка може слугувати добрим наближенням функції втрат, що зустрічається у застосуванні природним чином.[9]

Як і дисперсія, середньоквадратична похибка має недолік надавання великої ваги викидам.[10] Це є результатом піднесенням до квадрату кожного члену, через яке більші похибки заважують сильніше за менші. Ця властивість, небажана у багатьох застосуваннях, змусила дослідників використовувати такі альтернативи як Шаблон:Нп, або такі, що ґрунтуються на медіані.

Див. також

Виноски

Шаблон:Notelist

Примітки

Шаблон:Примітки