Напрямкова статистика

Матеріал з testwiki
Версія від 04:07, 3 жовтня 2024, створена imported>InternetArchiveBot (Виправлено джерел: 1; позначено як недійсні: 1.) #IABot (v2.0.9.5)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

На́прямкова стати́стика (також кругова́ стати́стика та сфери́чна стати́стика, Шаблон:Lang-en) — піддисципліна статистики, яка займається напрямками (одиничними векторами в евклідовому просторі, Rn), осями (прямими, що проходять крізь початок координат у Rn) або повертаннями в Rn. Загалом, напрямкова статистика має справу зі спостереженнями на компактних ріманових многовидах, включно з Шаблон:Iw.

Загальну форму білка можливо параметрувати як послідовність точок на одиничній сфері. Показано два види сферичної гістограми таких точок для великої колекції білкових структур. Статистична обробка таких даних належить до сфери напрямкової статистики.[1]

Той факт, що 0 градусів і 360 градусів — ідентичні кути, тож, наприклад, 180 градусів не є осмисленим середнім значенням 2 градусів і 358 градусів, є однією з ілюстрацій того, що для аналізу деяких типів даних (у цьому випадку кутових даних) потрібні спеціальні статистичні методи. До інших прикладів даних, які можна розглядати як напрямкові, належать статистичні дані, що містять періоди часу (наприклад, час доби, тиждень, місяць, рік тощо), напрямки за компасом, двогранні кути в молекулах, орієнтації, повертання тощо.

Кругові розподіли

Шаблон:Main Шаблон:Якір

Будь-яку функцію густини ймовірності (ФГЙ)  p(x) на прямій можливо «Шаблон:Iw»Шаблон:Sfn[2][3][4][5] (Шаблон:Lang-en) на коло одиничного радіуса.[6] Тобто ФГЙ намотаної змінної

θ=xw=xmod2π  (π,π]

це

pw(θ)=k=p(θ+2πk).

Цю концепцію можливо розширити на багатовимірний контекст шляхом розширення простої суми до низки F сум, які охоплюють усі виміри в просторі ознак:

pw(θ)=k1=kF=p(θ+2πk1𝐞1++2πkF𝐞F)

де 𝐞k=(0,,0,1,0,,0)𝖳 — k-й базисний вектор евклідового простору.

В наступних розділах показано декі доречні кругові розподіли.

Круговий розподіл фон Мізеса

Шаблон:Main

Розподіл фон Мізеса (Шаблон:Lang-en) — це круговий розподіл, який, як і будь-який інший круговий розподіл, можна розглядати як намотування певного розподілу ймовірності на прямій на коло. Розподіл імовірності на прямій, що лежить в основі розподілу фон Мізеса, математично непіддатливий; проте для статистичних цілей немає потреби мати справу з лінійним розподілом в основі. Корисність розподілу фон Мізеса подвійна: він математично найпіддатливіший серед усіх кругових розподілів, що уможливлює простіший статистичний аналіз, і він є близьким наближенням до Шаблон:Iw,[2][3][4] який, як і нормальний розподіл на прямій, важливий, оскільки це граничний випадок для суми великої кількості малих кутових відхилень. Насправді розподіл фон Мізеса часто називають «круговим нормальним» (Шаблон:Lang-en) розподілом через його легкість у використанні та тісний зв'язок із круговим нормальним розподілом.Шаблон:Sfn

ФГЙ розподілу фон Мізеса:

f(θ;μ,κ)=eκcos(θμ)2πI0(κ)

де I0 — видозмінена функція Бесселя порядку 0.

Круговий рівномірний розподіл

Шаблон:Main

ФГЙ кругового рівномірного розподілу (Шаблон:Lang-en) задають як

U(θ)=12π.

Її також можливо розглядати як випадок κ=0 розподілу фон Мізеса, наведеного вище.

Намотаний нормальний розподіл

Шаблон:Main

ФГЙ намотаного нормального розподілу:

WN(θ;μ,σ)=1σ2πk=exp[(θμ2πk)22σ2]=12πϑ(θμ2π,iσ22π)

де μ та σ — математичне сподівання та стандартне відхилення ненамотаного розподілу відповідно, а ϑ(θ,τ) — тета-функція Якобі

ϑ(θ,τ)=n=(w2)nqn2

де weiπθ, а qeiπτ.

Намотаний розподіл Коші

Шаблон:Main

ФГЙ намотаного розподілу КошіШаблон:Sfn[2][3][4] (Шаблон:Lang-en) така:

WC(θ;θ0,γ)=n=γπ(γ2+(θ+2πnθ0)2)=12πsinhγcoshγcos(θθ0)

де γ — коефіцієнт масштабу, а θ0 — позиція піку.

Намотаний розподіл Леві

Шаблон:Main

ФГЙ намотаного розподілу Леві[3] (Шаблон:Lang-en):

fWL(θ;μ,c)=n=c2πec/2(θ+2πnμ)(θ+2πnμ)3/2

де значення доданка береться нульовим, коли θ+2πnμ0, c — коефіцієнт масштабу, а μ — параметр розташування.

Проєктований нормальний розподіл

Шаблон:Main

Проєктований нормальний розподіл (Шаблон:Lang-en) — це круговий розподіл, що подає напрямок випадкової величини з багатовимірним нормальним розподілом, отримуваний шляхом радіальної проєкції цієї змінної на одиничну (n-1)-сферу. Через це, на відміну від інших широко використовуваних кругових розподілів, він ані симетричний, ані одномодовий.

Розподіли на многовидах вищої вимірності

Три набори точок, вибрані з різних розподілів Кента на сфері.

Також існують розподіли на двовимірній сфері (як-от Шаблон:Iw[7]), N-вимірній сфері (Шаблон:Iw[8]) й на торі (Шаблон:Iw[9]).

Шаблон:Iw[10] — розподіл на Шаблон:Iw, який можливо використовувати для побудови ймовірнісних розподілів за матрицями повороту.[11]

Шаблон:Iw — це розподіл над осями в N вимірах або, що еквівалентно, над точками на (N − 1)-вимірній сфері з ототожненими антиподами.[12] Наприклад, якщо N = 2, осі — неорієнтовані прямі, що проходять крізь початок координат на площині. У цьому випадку кожна вісь перетинає одиничне коло на площині (яке є одновимірною сферою) у двох точках, що є антиподами одна одної. Для N = 4 розподіл Бінгема є розподілом у просторі одиничних кватерніонів (Шаблон:Iw). Оскільки версор відповідає матриці повороту, розподіл Бінгема для N = 4 можливо використовувати для побудови розподілу ймовірності в просторі обертань, як і матричний розподіл фон Мізеса — Фішера.

Ці розподіли, наприклад, використовують у геології,[13] кристалографії[14] та біоінформатиці.[1][15][16]

Моменти

Необроблені векторні (або тригонометричні) моменти кругового розподілу визначають як

mn=E(zn)=ΓP(θ)zndθ

де Γ це будь-який інтервал довжини 2π, P(θ) це ФГЙ кругового розподілу, а z=eiθ. Оскільки інтеграл P(θ) одиничний, а інтервал інтегрування скінченний, з цього випливає, що моменти будь-якого кругового розподілу завжди скінченні й добре визначені.

Моменти вибірки визначають аналогічно:

mn=1Ni=1Nzin.

Результуючий вектор сукупності, довжину та середній кут визначають за аналогією з відповідними параметрами вибірки.

ρ=m1
R=|m1|
θn=Arg(mn).

Крім того, довжини старших моментів визначають як

Rn=|mn|

а кутові частини вищих моментів це просто (nθn)mod2π. Довжини всіх моментів лежатимуть між 0 та 1.

Міри розташування та розсіяння

Як для сукупності, так і для вибраної з цієї сукупності вибірки, можна визначити різні показники центральної тенденції та статистичної дисперсії.Шаблон:Sfn

Центральна тенденція

Шаблон:Main

Найпоширенішою мірою розташування є кругове середнє (Шаблон:Lang-en). Кругове середнє сукупності — це просто перший момент розподілу, тоді як середнє вибірки — це перший момент вибірки. Вибіркове середнє слугуватиме незміщеною оцінкою середнього сукупності.

Коли дані зосереджені, медіану та моду можна визначати за аналогією з лінійним випадком, але для розсіяніших або багатомодових даних ці поняття не несуть користі.

Дисперсія

Шаблон:Див. також

Найпоширенішими мірами кругового розсіяння є:

Var(z)=1R,

а для генеральної сукупності як

Var(z)=1R

Обидві матимуть значення між 0 та 1.

S(z)=ln(1/R2)=2ln(R) S(z)=ln(1/R2)=2ln(R)

зі значеннями від 0 до нескінченності. Це визначення стандартного відхилення (замість квадратного кореня з дисперсії) корисне, оскільки для намотаного нормального розподілу воно є оцінкою стандартного відхилення нормального розподілу в основі. Таким чином, це дозволить стандартизувати круговий розподіл, як у випадку на прямій, для малих значень стандартного відхилення. Це також стосується розподілу фон Мізеса, який дуже наближений до намотаного нормального розподілу. Зверніть увагу, що для малого S(z) буде S(z)2=2Var(z).

δ=1R22R2 δ=1R22R2

зі значеннями від 0 до нескінченності. Ця міра розсіяння корисна для статистичного аналізу дисперсії.

Розподіл середнього

За набору N вимірювань zn=eiθn середнє значення z визначають як

z=1Nn=1Nzn

що можна виразити як

z=C+iS

де

C=1Nn=1Ncos(θn) та S=1Nn=1Nsin(θn)

або, іншим чином, як:

z=Reiθ

де

R=C2+S2 та θ=arctan(S/C).

Розподіл середнього кута (θ) для кругової ФГЙ P(θ) буде задано як

P(C,S)dCdS=P(R,θ)dRdθ=ΓΓn=1N[P(θn)dθn]

де Γ знаходиться на будь-якому інтервалі довжини 2π і на інтеграл поширюється обмеження, що S та C сталі, або, іншим чином, що R та θ сталі.

Розрахунок розподілу середнього для більшості кругових розподілів аналітично неможливий, і для здійснення дисперсійного аналізу потрібні числові або математичні наближення.Шаблон:Sfn

До цього розподілу вибіркових середніх можна застосовувати центральну граничну теорему. (основна стаття: Шаблон:Iw). Можливо показати,Шаблон:Sfn що розподіл [C,S] при границі розміру великої вибірки наближається до двовимірного нормального розподілу.

Перевірка допасованості та значущості

Для циклічних даних — (наприклад, чи вони рівномірно розподілені) :

Див. також

Примітки

Шаблон:Reflist

Книги з напрямкової статистики

Шаблон:Розподіли ймовірності

  1. 1,0 1,1 Шаблон:Cite journal
  2. 2,0 2,1 2,2 2,3 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою КуцШенгур2010 не вказано текст
  3. 3,0 3,1 3,2 3,3 3,4 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою КуцШенгур2011a не вказано текст
  4. 4,0 4,1 4,2 4,3 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою КуцШенгур2011b не вказано текст
  5. 5,0 5,1 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою КуцЛисенкоЛевченко2020 не вказано текст
  6. Bahlmann, C., (2006), Directional features in online handwriting recognition, Pattern Recognition Шаблон:Ref-en, 39
  7. Kent, J (1982) The Fisher–Bingham distribution on the sphereШаблон:Недоступне посилання. Шаблон:Ref-en J Royal Stat Soc, 44, 71–80.
  8. Fisher, RA (1953) Dispersion on a sphere. Шаблон:Ref-en Proc. Roy. Soc. London Ser. A., 217, 295—305
  9. Шаблон:Cite journal
  10. Шаблон:Cite journal
  11. Шаблон:Cite journal
  12. Шаблон:Cite journal
  13. Шаблон:Cite journal
  14. Шаблон:Cite journal
  15. Kent, J.T., Hamelryck, T. (2005). Using the Fisher–Bingham distribution in stochastic models for protein structure Шаблон:Webarchive. In S. Barber, P.D. Baxter, K.V.Mardia, & R.E. Walls (Eds.), Quantitative Biology, Shape Analysis, and Wavelets Шаблон:Ref-en, pp. 57–60. Leeds, Leeds University Press
  16. Шаблон:Cite journal