Напрямкова статистика
На́прямкова стати́стика (також кругова́ стати́стика та сфери́чна стати́стика, Шаблон:Lang-en) — піддисципліна статистики, яка займається напрямками (одиничними векторами в евклідовому просторі, Rn), осями (прямими, що проходять крізь початок координат у Rn) або повертаннями в Rn. Загалом, напрямкова статистика має справу зі спостереженнями на компактних ріманових многовидах, включно з Шаблон:Iw.

Той факт, що 0 градусів і 360 градусів — ідентичні кути, тож, наприклад, 180 градусів не є осмисленим середнім значенням 2 градусів і 358 градусів, є однією з ілюстрацій того, що для аналізу деяких типів даних (у цьому випадку кутових даних) потрібні спеціальні статистичні методи. До інших прикладів даних, які можна розглядати як напрямкові, належать статистичні дані, що містять періоди часу (наприклад, час доби, тиждень, місяць, рік тощо), напрямки за компасом, двогранні кути в молекулах, орієнтації, повертання тощо.
Кругові розподіли
Будь-яку функцію густини ймовірності (ФГЙ) на прямій можливо «Шаблон:Iw»Шаблон:Sfn[2][3][4][5] (Шаблон:Lang-en) на коло одиничного радіуса.[6] Тобто ФГЙ намотаної змінної
це
Цю концепцію можливо розширити на багатовимірний контекст шляхом розширення простої суми до низки сум, які охоплюють усі виміри в просторі ознак:
де — -й базисний вектор евклідового простору.
В наступних розділах показано декі доречні кругові розподіли.
Круговий розподіл фон Мізеса
Розподіл фон Мізеса (Шаблон:Lang-en) — це круговий розподіл, який, як і будь-який інший круговий розподіл, можна розглядати як намотування певного розподілу ймовірності на прямій на коло. Розподіл імовірності на прямій, що лежить в основі розподілу фон Мізеса, математично непіддатливий; проте для статистичних цілей немає потреби мати справу з лінійним розподілом в основі. Корисність розподілу фон Мізеса подвійна: він математично найпіддатливіший серед усіх кругових розподілів, що уможливлює простіший статистичний аналіз, і він є близьким наближенням до Шаблон:Iw,[2][3][4] який, як і нормальний розподіл на прямій, важливий, оскільки це граничний випадок для суми великої кількості малих кутових відхилень. Насправді розподіл фон Мізеса часто називають «круговим нормальним» (Шаблон:Lang-en) розподілом через його легкість у використанні та тісний зв'язок із круговим нормальним розподілом.Шаблон:Sfn
ФГЙ розподілу фон Мізеса:
де — видозмінена функція Бесселя порядку 0.
Круговий рівномірний розподіл
ФГЙ кругового рівномірного розподілу (Шаблон:Lang-en) задають як
Її також можливо розглядати як випадок розподілу фон Мізеса, наведеного вище.
Намотаний нормальний розподіл
ФГЙ намотаного нормального розподілу:
де μ та σ — математичне сподівання та стандартне відхилення ненамотаного розподілу відповідно, а — тета-функція Якобі
де , а
Намотаний розподіл Коші
ФГЙ намотаного розподілу КошіШаблон:Sfn[2][3][4] (Шаблон:Lang-en) така:
де — коефіцієнт масштабу, а — позиція піку.
Намотаний розподіл Леві
ФГЙ намотаного розподілу Леві[3] (Шаблон:Lang-en):
де значення доданка береться нульовим, коли , — коефіцієнт масштабу, а — параметр розташування.
Проєктований нормальний розподіл
Проєктований нормальний розподіл (Шаблон:Lang-en) — це круговий розподіл, що подає напрямок випадкової величини з багатовимірним нормальним розподілом, отримуваний шляхом радіальної проєкції цієї змінної на одиничну (n-1)-сферу. Через це, на відміну від інших широко використовуваних кругових розподілів, він ані симетричний, ані одномодовий.
Розподіли на многовидах вищої вимірності

Також існують розподіли на двовимірній сфері (як-от Шаблон:Iw[7]), N-вимірній сфері (Шаблон:Iw[8]) й на торі (Шаблон:Iw[9]).
Шаблон:Iw[10] — розподіл на Шаблон:Iw, який можливо використовувати для побудови ймовірнісних розподілів за матрицями повороту.[11]
Шаблон:Iw — це розподіл над осями в N вимірах або, що еквівалентно, над точками на (N − 1)-вимірній сфері з ототожненими антиподами.[12] Наприклад, якщо N = 2, осі — неорієнтовані прямі, що проходять крізь початок координат на площині. У цьому випадку кожна вісь перетинає одиничне коло на площині (яке є одновимірною сферою) у двох точках, що є антиподами одна одної. Для N = 4 розподіл Бінгема є розподілом у просторі одиничних кватерніонів (Шаблон:Iw). Оскільки версор відповідає матриці повороту, розподіл Бінгема для N = 4 можливо використовувати для побудови розподілу ймовірності в просторі обертань, як і матричний розподіл фон Мізеса — Фішера.
Ці розподіли, наприклад, використовують у геології,[13] кристалографії[14] та біоінформатиці.[1][15][16]
Моменти
Необроблені векторні (або тригонометричні) моменти кругового розподілу визначають як
де це будь-який інтервал довжини , це ФГЙ кругового розподілу, а . Оскільки інтеграл одиничний, а інтервал інтегрування скінченний, з цього випливає, що моменти будь-якого кругового розподілу завжди скінченні й добре визначені.
Моменти вибірки визначають аналогічно:
Результуючий вектор сукупності, довжину та середній кут визначають за аналогією з відповідними параметрами вибірки.
Крім того, довжини старших моментів визначають як
а кутові частини вищих моментів це просто . Довжини всіх моментів лежатимуть між 0 та 1.
Міри розташування та розсіяння
Як для сукупності, так і для вибраної з цієї сукупності вибірки, можна визначити різні показники центральної тенденції та статистичної дисперсії.Шаблон:Sfn
Центральна тенденція
Найпоширенішою мірою розташування є кругове середнє (Шаблон:Lang-en). Кругове середнє сукупності — це просто перший момент розподілу, тоді як середнє вибірки — це перший момент вибірки. Вибіркове середнє слугуватиме незміщеною оцінкою середнього сукупності.
Коли дані зосереджені, медіану та моду можна визначати за аналогією з лінійним випадком, але для розсіяніших або багатомодових даних ці поняття не несуть користі.
Дисперсія
Найпоширенішими мірами кругового розсіяння є:
- Шаблон:Якір2 (Шаблон:Lang-en). Для вибірки кругову дисперсію визначають як
- а для генеральної сукупності як
- Обидві матимуть значення між 0 та 1.
- зі значеннями від 0 до нескінченності. Це визначення стандартного відхилення (замість квадратного кореня з дисперсії) корисне, оскільки для намотаного нормального розподілу воно є оцінкою стандартного відхилення нормального розподілу в основі. Таким чином, це дозволить стандартизувати круговий розподіл, як у випадку на прямій, для малих значень стандартного відхилення. Це також стосується розподілу фон Мізеса, який дуже наближений до намотаного нормального розподілу. Зверніть увагу, що для малого буде .
- зі значеннями від 0 до нескінченності. Ця міра розсіяння корисна для статистичного аналізу дисперсії.
Розподіл середнього
За набору N вимірювань середнє значення z визначають як
що можна виразити як
де
або, іншим чином, як:
де
Розподіл середнього кута () для кругової ФГЙ P(θ) буде задано як
де знаходиться на будь-якому інтервалі довжини і на інтеграл поширюється обмеження, що та сталі, або, іншим чином, що та сталі.
Розрахунок розподілу середнього для більшості кругових розподілів аналітично неможливий, і для здійснення дисперсійного аналізу потрібні числові або математичні наближення.Шаблон:Sfn
До цього розподілу вибіркових середніх можна застосовувати центральну граничну теорему. (основна стаття: Шаблон:Iw). Можливо показати,Шаблон:Sfn що розподіл при границі розміру великої вибірки наближається до двовимірного нормального розподілу.
Перевірка допасованості та значущості
Для циклічних даних — (наприклад, чи вони рівномірно розподілені) :
- Шаблон:Iw для одномодового кластера
- Тест Куйпера для можливо багатомодових даних.
Див. також
Примітки
Книги з напрямкової статистики
- Шаблон:Cite book
- Шаблон:Cite book
- Шаблон:Cite book
- Шаблон:Cite book
- Шаблон:Cite book
- Шаблон:Cite book
- Шаблон:Cite book
- ↑ 1,0 1,1 Шаблон:Cite journal
- ↑ 2,0 2,1 2,2 2,3 Помилка цитування: Неправильний виклик тегу
<ref>: для виносок під назвоюКуцШенгур2010не вказано текст - ↑ 3,0 3,1 3,2 3,3 3,4 Помилка цитування: Неправильний виклик тегу
<ref>: для виносок під назвоюКуцШенгур2011aне вказано текст - ↑ 4,0 4,1 4,2 4,3 Помилка цитування: Неправильний виклик тегу
<ref>: для виносок під назвоюКуцШенгур2011bне вказано текст - ↑ 5,0 5,1 Помилка цитування: Неправильний виклик тегу
<ref>: для виносок під назвоюКуцЛисенкоЛевченко2020не вказано текст - ↑ Bahlmann, C., (2006), Directional features in online handwriting recognition, Pattern Recognition Шаблон:Ref-en, 39
- ↑ Kent, J (1982) The Fisher–Bingham distribution on the sphereШаблон:Недоступне посилання. Шаблон:Ref-en J Royal Stat Soc, 44, 71–80.
- ↑ Fisher, RA (1953) Dispersion on a sphere. Шаблон:Ref-en Proc. Roy. Soc. London Ser. A., 217, 295—305
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Шаблон:Cite journal
- ↑ Kent, J.T., Hamelryck, T. (2005). Using the Fisher–Bingham distribution in stochastic models for protein structure Шаблон:Webarchive. In S. Barber, P.D. Baxter, K.V.Mardia, & R.E. Walls (Eds.), Quantitative Biology, Shape Analysis, and Wavelets Шаблон:Ref-en, pp. 57–60. Leeds, Leeds University Press
- ↑ Шаблон:Cite journal