Метод проксимального градієнта

Метод проксимального градієнта^[1] — узагальнення проєктування, що використовується для розв'язання недиференційовних задач опуклого програмування.

Багато цікавих задач можна сформулювати як задачі опуклого програмування

$\min_{x \in ℝ^{N}} \sum_{i = 1}^{n} f_{i} (x)$

де $f_{i}, i = 1, \dots, n$ — опуклі функції, визначені як відображення $f : ℝ^{N} \to ℝ$ , де деякі з функцій недиференційовні, що виключає звичайні техніки гладкої оптимізації, такі як метод найшвидшого спуску або метод спряжених градієнтів тощо, замість них можна використати проксимальні градієнтні методи. Ці методи ґрунтуються на розщепленні, тому функції $f_{1}, . . ., f_{n}$ використовуються індивідуально, що дозволяє розробити простіші для реалізації алгоритми. Їх називають проксимальними (Шаблон:Lang-en — найближчий), оскільки кожна не гладка функція серед $f_{1}, . . ., f_{n}$ залучається до процесу через Шаблон:Нп. Ітераційний алгоритм м'якої порогової фільтраціїШаблон:Sfn, Шаблон:Нп, проєкція градієнта, поперемінні проєкції, Шаблон:Не перекладено , метод почергових розщеплень Шаблон:Нп є окремими випадками проксимальних алгоритмівШаблон:R.

Позначення та термінологія

Нехай $ℝ^{N}$ , $N$ -вимірний евклідів простір, є областю визначення функції $f : ℝ^{N} \to (- \infty, + \infty]$ . Припустимо, що $C$ є непорожньою опуклою підмножиною множини $ℝ^{N}$ . Тоді індикаторна функція множини $C$ визначається як

ι_{C} : x \mapsto {\begin{matrix} 0 & x \in C \\ + \infty & x \notin C \end{matrix}

p

-норма визначається як

(‖ \cdot ‖_{p})

‖ x ‖_{p} = (| x_{1} |^{p} + | x_{2} |^{p} + \dots + | x_{N} |^{p})^{1 / p}

Відстань від $x \in ℝ^{N}$ до $C$ визначається як

D_{C} (x) = \min_{y \in C} ‖ x - y ‖_{2}

Якщо $C$ замкнута та опукла, проекцією $x \in ℝ^{N}$ у множну $C$ є єдина точка $P_{C} x \in C$ , така що $D_{C} (x) = ‖ x - P_{C} x ‖_{2}$ .

Субдиференціал функції $f$ у точці $x$ задається виразом

\partial f (x) = {u \in ℝ^{N} ∣ \forall y \in ℝ^{N}, (y - x)^{T} u + f (x) ⩽ f (y) .}

Проектування в опуклі множини

Одним із широко використовуваних опуклих алгоритмів оптимізації є Шаблон:Нп. Цей алгоритм використовується для виявлення/синтезування сигналу, що задовольняє одночасно кілька опуклих обмежень. Нехай $f_{i}$ — індикаторна функція на непорожній замкнутій опуклій множині $C_{i}$ , що моделює обмеження. Це зводить задачу до задачі опуклої здійсненності (досяжності), в якій потрібно знайти розв'язок, що міститься в перетині всіх опуклих множин $C_{i}$ . У методі проєктування в опуклі множини кожна множина $C_{i}$ асоціюється з її проєктором $P_{C_{i}}$ . Таким чином, на кожній ітерації $x$ перераховується за формулою

x_{k + 1} = P_{C_{1}} P_{C_{2}} \dots P_{C_{n}} x_{k}

Проте поза такими задачами проєктори не підходять і потрібні оператори загальнішого вигляду. Серед різних узагальнень поняття опуклого проєктора проксимальні оператори найкраще підходять для таких цілей.

Визначення

Шаблон:Не перекладено опуклої функції $f$ у точці $x$ визначається як єдиний розв'язок

\underset{y}{argmin} (f (y) + \frac{1}{2} {‖ x - y ‖}_{2}^{2})

і позначається як ${prox}_{f} (x)$ .

{prox}_{f} (x) : ℝ^{N} \to ℝ^{N}

Зауважимо, що у випадку, коли $f$ є індикаторною функцією $ι_{C}$ деякої опуклої множини $C$

\begin{matrix} {prox}_{ι_{C}} (x) & = \underset{y}{argmin} {\begin{matrix} \frac{1}{2} {‖ x - y ‖}_{2}^{2} & y \in C \\ + \infty & y \notin C \end{matrix} \\ = \underset{y \in C}{argmin} \frac{1}{2} {‖ x - y ‖}_{2}^{2} \\ = P_{C} (x) \end{matrix}

що показує, що проксимальний оператор справді є узагальненням проєктора.

Проксимальний оператор функції $f$ описується включенням

p = {prox}_{f} (x) \Leftrightarrow x - p \in \partial f (p) (\forall (x, p) \in ℝ^{N} \times ℝ^{N})

Якщо $f$ диференційовна, то наведене рівняння вище зводиться до

p = {prox}_{f} (x) \Leftrightarrow x - p = \nabla f (p) (\forall (x, p) \in ℝ^{N} \times ℝ^{N})

Приклади

Окремими випадками проксимальних градієнтних методів є:

Див. також

Примітки

Шаблон:Reflist

Література

Посилання

Stephen Boyd, Lieven Vandenberghe, Convex optimization
EE364a: Convex Optimization I та EE364b: Convex Optimization II — сторінки стенфордського курсу
EE227A: Lieven Vandenberghe Notes Лекція 18
ProximalOperators.jl — пакунок на мові Julia, що реалізує проксимальні оператори.
ProximalAlgorithms.jl — пакунок на мові Julia, що реалізує алгоритми, які базуються на проксимальних операторах, включно зі проксимальним градієнтним методом.
Proximity Operator repository — набір проксимальних операторів, реалізованих у MATLAB та мовою Python.

Шаблон:Методи оптимізації

↑ Шаблон:Lang-en = найближчий

[1] Шаблон:Lang-en = найближчий

[1]

Метод проксимального градієнта

Зміст

Позначення та термінологія

Проектування в опуклі множини

Визначення

Приклади

Див. також

Примітки

Література

Посилання

Навігаційне меню

Метод проксимального градієнта

Позначення та термінологія

Проектування в опуклі множини

Визначення

Приклади

Див. також

Примітки

Література

Посилання

Навігаційне меню

Пошук