Мажорування стресу

Матеріал з testwiki
Версія від 16:20, 26 квітня 2022, створена imported>Lxlalexlxl
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Мажорування стресу — це стратегія оптимізації, використовувана в багатовимірному шкалюванні, де для набору з n елементів розмірності m шукається конфігурація X n точок у r(<<m)-вимірному просторі, яка мінімізує так звану функцію мажорування σ(X). Зазвичай r дорівнює 2 або 3, тобто (n x r) матриця X перераховує точки в 2- або 3-вимірному евклідовому просторі, так що результат можна відобразити візуально. Функція σ є ціною або функцією втрат, яка вимірює квадрат різниці між ідеальною (m-вимірною) відстанню і актуальною відстанню в r-вимірному просторі. Вона визначається як:

σ(X)=i<jnwij(dij(X)δij)2,

де wij0 — вага для мір між парами точок (i,j), dij(X) — евклідова відстань між i і j, а δij — ідеальна відстань між точками в m-вимірному просторі. Зауважимо, що wij можна використати для задання ступеня довіри в схожості точок (наприклад, можна вказати 0, якщо для конкретної пари немає ніякої інформації).

Конфігурація X, яка мінімізує σ(X), дає графік, на якому близькі точки відповідають близьким точкам у початковому m-вимірному просторі.

Існує багато шляхів мінімізації σ(X). Наприклад, КрускалШаблон:Sfn рекомендує ітеративний підхід найшвидшого спуску. Однак істотно кращий (у термінах гарантованості і швидкості збіжності) метод мінімізації стресу запропонував Ян де ЛейвШаблон:Sfn. Метод ітеративного мажорування де Лейва на кожному кроці мінімізує просту опуклу функцію, яка обмежує σ зверху і дотикається до поверхні σ в точці Z, яку називають опорною точкою. В опуклому аналізі таку функцію називають мажорувальною функцією. Цей ітеративний процес мажорування також відомий як алгоритм SMACOF (Шаблон:Lang-en).

Алгоритм SMACOF

Функцію стресу σ можна розкласти так:

σ(X)=i<jnwij(dij(X)δij)2=i<jwijδij2+i<jwijdij2(X)2i<jwijδijdij(X)

Зауважимо, що перший член є константою C, а другий залежить квадратично від X (тобто для матриці Гесе V другий член еквівалентний trXVX), а тому відносно просто обчислюється. Третій член обмежений величиною

i<jwijδijdij(X)=trXB(X)XtrXB(Z)Z,

де B(Z) має елементи

bij=wijδijdij(Z) для dij(Z)0,ij

bij=0 для dij(Z)=0,ij

bii=j=1,jinbij.

Ця нерівність доводиться через нерівність Коші — Буняковського (див. статтю БоргаШаблон:Sfn).

Таким чином, ми маємо просту квадратичну функцію τ(X,Z), яка мажорує стрес:

σ(X)=C+trXVX2trXB(X)X
C+trXVX2trXB(Z)Z=τ(X,Z)


Тоді ітеративна процедура мажорування робить таке:

  • на кроці k ми приймаємо ZXk1
  • XkminXτ(X,Z)
  • зупиняємося, якщо σ(Xk1)σ(Xk)<ϵ, в іншому випадку повертаємося на початок.

Показано, що цей алгоритм зменшує стрес монотонно (див. статтю де ЛейваШаблон:Sfn).

Використання у візуалізації графів

Мажорування стресу і алгоритми, подібні SMACOF, застосовуються також у галузі візуалізації графівШаблон:SfnШаблон:Sfn. Тобто, завдякимінімізації функції стресу, можна знайти більш-менш естетичне розташування вершин для мережі або графа. В цьому випадку δij зазвичай береться як відстань (у сенсі теорії графів) між вузлами (вершинами) i і j, а ваги wij беруться рівними δijα. Тут α вибирається як компроміс між збереженням великих і малих ідеальних відстаней. Хороші результати отримано для α=2Шаблон:Sfn.

Примітки

Шаблон:Reflist

Література

Шаблон:Refbegin

Шаблон:Refend Шаблон:Бібліоінформація