Мажорування стресу

Мажорування стресу — це стратегія оптимізації, використовувана в багатовимірному шкалюванні, де для набору з n елементів розмірності m шукається конфігурація X n точок у r(<<m)-вимірному просторі, яка мінімізує так звану функцію мажорування $σ (X)$ . Зазвичай r дорівнює 2 або 3, тобто (n x r) матриця X перераховує точки в 2- або 3-вимірному евклідовому просторі, так що результат можна відобразити візуально. Функція $σ$ є ціною або функцією втрат, яка вимірює квадрат різниці між ідеальною ( $m$ -вимірною) відстанню і актуальною відстанню в r-вимірному просторі. Вона визначається як:

σ (X) = \sum_{i < j ⩽ n} w_{i j} (d_{i j} (X) - δ_{i j})^{2}

,

де $w_{i j} ⩾ 0$ — вага для мір між парами точок $(i, j)$ , $d_{i j} (X)$ — евклідова відстань між $i$ і $j$ , а $δ_{i j}$ — ідеальна відстань між точками в $m$ -вимірному просторі. Зауважимо, що $w_{i j}$ можна використати для задання ступеня довіри в схожості точок (наприклад, можна вказати 0, якщо для конкретної пари немає ніякої інформації).

Конфігурація $X$ , яка мінімізує $σ (X)$ , дає графік, на якому близькі точки відповідають близьким точкам у початковому $m$ -вимірному просторі.

Існує багато шляхів мінімізації $σ (X)$ . Наприклад, КрускалШаблон:Sfn рекомендує ітеративний підхід найшвидшого спуску. Однак істотно кращий (у термінах гарантованості і швидкості збіжності) метод мінімізації стресу запропонував Ян де ЛейвШаблон:Sfn. Метод ітеративного мажорування де Лейва на кожному кроці мінімізує просту опуклу функцію, яка обмежує $σ$ зверху і дотикається до поверхні $σ$ в точці $Z$ , яку називають опорною точкою. В опуклому аналізі таку функцію називають мажорувальною функцією. Цей ітеративний процес мажорування також відомий як алгоритм SMACOF (Шаблон:Lang-en).

Алгоритм SMACOF

Функцію стресу $σ$ можна розкласти так:

σ (X) = \sum_{i < j ⩽ n} w_{i j} (d_{i j} (X) - δ_{i j})^{2} = \sum_{i < j} w_{i j} δ_{i j}^{2} + \sum_{i < j} w_{i j} d_{i j}^{2} (X) - 2 \sum_{i < j} w_{i j} δ_{i j} d_{i j} (X)

Зауважимо, що перший член є константою $C$ , а другий залежить квадратично від X (тобто для матриці Гесе V другий член еквівалентний tr $X^{'} V X$ ), а тому відносно просто обчислюється. Третій член обмежений величиною

\sum_{i < j} w_{i j} δ_{i j} d_{i j} (X) = tr X^{'} B (X) X ⩾ tr X^{'} B (Z) Z

,

де $B (Z)$ має елементи

b_{i j} = - \frac{w_{i j} δ_{i j}}{d_{i j} (Z)}

для

d_{i j} (Z) \neq 0, i \neq j

$b_{i j} = 0$ для $d_{i j} (Z) = 0, i \neq j$

$b_{i i} = - \sum_{j = 1, j \neq i}^{n} b_{i j}$ .

Ця нерівність доводиться через нерівність Коші — Буняковського (див. статтю БоргаШаблон:Sfn).

Таким чином, ми маємо просту квадратичну функцію $τ (X, Z)$ , яка мажорує стрес:

σ (X) = C + tr X^{'} V X - 2 tr X^{'} B (X) X

⩽ C + tr X^{'} V X - 2 tr X^{'} B (Z) Z = τ (X, Z)

Тоді ітеративна процедура мажорування робить таке:

на кроці k ми приймаємо $Z \leftarrow X^{k - 1}$
$X^{k} \leftarrow \min_{X} τ (X, Z)$
зупиняємося, якщо $σ (X^{k - 1}) - σ (X^{k}) < ϵ$ , в іншому випадку повертаємося на початок.

Показано, що цей алгоритм зменшує стрес монотонно (див. статтю де ЛейваШаблон:Sfn).

Використання у візуалізації графів

Мажорування стресу і алгоритми, подібні SMACOF, застосовуються також у галузі візуалізації графів Шаблон:Sfn Шаблон:Sfn. Тобто, завдякимінімізації функції стресу, можна знайти більш-менш естетичне розташування вершин для мережі або графа. В цьому випадку $δ_{i j}$ зазвичай береться як відстань (у сенсі теорії графів) між вузлами (вершинами) i і j, а ваги $w_{i j}$ беруться рівними $δ_{i j}^{- α}$ . Тут $α$ вибирається як компроміс між збереженням великих і малих ідеальних відстаней. Хороші результати отримано для $α = 2$ Шаблон:Sfn.

Примітки

Шаблон:Reflist

Література

Шаблон:Refbegin

Шаблон:Refend Шаблон:Бібліоінформація

Мажорування стресу

Зміст

Алгоритм SMACOF

Використання у візуалізації графів

Примітки

Література

Навігаційне меню

Мажорування стресу

Алгоритм SMACOF

Використання у візуалізації графів

Примітки

Література

Навігаційне меню

Пошук