Метрика Васерштейна

Матеріал з testwiki
Версія від 11:25, 11 листопада 2023, створена imported>Olexa Riznyk (Olexa Riznyk перейменував сторінку з Метрика Вассерштейна на Метрика Васерштейна: Помилка в назві)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

У математиці, відстань Шаблон:Нп або метрика Канторовича-Шаблон:Нп — це функція відстані, визначена між розподілами ймовірностей у заданому метричному просторі M. Названа на честь Шаблон:Нп.[1]

Означення

Нехай (M,d) — метричний простір, де кожна міра є мірою Радона. Для p[1,+], p — відстань Васерштейна між двома ймовірнісними мірами μ та ν на M зі скінченними p-ми моментами визначається як

Wp(μ.ν)=(inf\limits γΓ(μ,ν)𝔼(x,y)γd(x,y)p)1p,

де Γ(μ,ν) — множина всіх каплінгів μ та ν. Каплінг γ — це спільний розподіл ймовірностей на M×M такий, що

Mγ(x,y)dy=μ(x),Mγ(x,y)dx=ν(y).

Приклади

Детерміновані розподіли

Нехай μ1=δa1 та μ2=δa2 — два виродженні розподіли, зосереджені в точках a1 та a2 в . Існує тільки один можливий каплінг цих двох мір — δ(a1,a2),(a1,a2)2. Тоді, використовуючи модуль різниці як метрику на , для довільного p1, p-відстань Васерштейна між мірами μ1 та μ2 визначається як

Wp(μ1,μ2)=|a1a2|.


Одновимірні розподіли

Нехай μ1,μ2 — ймовірнісні міри на . Позначимо їхні функції розподілу ймовірностей як F1(x) та F2(x) відповідно. Тоді p-відстань Васерштейна між мірами μ1 та μ2 визначається як

Wp(μ1,μ2)=(01|F11(q)F21(q)|pdq)1p.

У випадку p=1, використовуючи формулу заміни змінних, отримуємо

W1(μ1,μ2)=|F1(x)F2(x)|dx.

Нормальний розподіл

Нехай μ1=N(m1,C1),μ2=N(m2,C2) — дві невиродженні гаусові міри в n з середніми m1 та m2 і матрицями коваріації C1 та C2 відповідно. Тоді, використовуючи звичайну евклідову метрику на n, 2-відстань Васерштейна для μ1 та μ2 визначається як

W2(μ1,μ2)2=m1m222+tr(C1+C22(C212C1C212)12).

Властивості

  • Збіжність в метриці Wp еквівалентна звичайній слабкій збіжності плюс збіжності перших p-их моментів.[2]
  • Якщо μ та ν мають обмежений носій, то
W1(μ,ν)=sup{Mf(x)d(μν)(x)|continuousf:M,Lip(f)1}, де Lip(f) — найменша константа Ліпшиця для f.[3]
  • Нехай 𝑷p(M) — сукупність всіх ймовірнісних мір на M зі скінченним p-м моментом. Для довільного p1, метричний простір (𝑷p(M),Wp) є повним та сепарабельним, якщо (M,d) — повний та сепарабельний.[4]

Див. також

Література

Шаблон:Reflist

Додаткова література

Шаблон:Refbegin

Шаблон:Refend