Метод проксимального градієнта

Матеріал з testwiki
Версія від 17:09, 26 червня 2023, створена imported>BunykBot (спроби виправити вікіфікацію)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Метод проксимального градієнта[1] — узагальнення проєктування, що використовується для розв'язання недиференційовних задач опуклого програмування.

Багато цікавих задач можна сформулювати як задачі опуклого програмування

minxNi=1nfi(x)

де fi, i=1,,n — опуклі функції, визначені як відображення f:N, де деякі з функцій недиференційовні, що виключає звичайні техніки гладкої оптимізації, такі як метод найшвидшого спуску або метод спряжених градієнтів тощо, замість них можна використати проксимальні градієнтні методи. Ці методи ґрунтуються на розщепленні, тому функції f1,...,fn використовуються індивідуально, що дозволяє розробити простіші для реалізації алгоритми. Їх називають проксимальними (Шаблон:Lang-en — найближчий), оскільки кожна не гладка функція серед f1,...,fn залучається до процесу через Шаблон:Нп. Ітераційний алгоритм м'якої порогової фільтраціїШаблон:Sfn, Шаблон:Нп, проєкція градієнта, поперемінні проєкції, Шаблон:Не перекладено , метод почергових розщеплень Шаблон:Нп є окремими випадками проксимальних алгоритмівШаблон:R.

Позначення та термінологія

Нехай N, N-вимірний евклідів простір, є областю визначення функції f:N(,+]. Припустимо, що C є непорожньою опуклою підмножиною множини N. Тоді індикаторна функція множини C визначається як

ιC:x{0xC+xC
p-норма визначається як (p)
xp=(|x1|p+|x2|p++|xN|p)1/p

Відстань від xN до C визначається як

DC(x)=minyCxy2

Якщо C замкнута та опукла, проекцією xN у множну C є єдина точка PCxC, така що DC(x)=xPCx2.

Субдиференціал функції f у точці x задається виразом

f(x)={uNyN,(yx)Tu+f(x)f(y).}

Проектування в опуклі множини

Одним із широко використовуваних опуклих алгоритмів оптимізації є Шаблон:Нп. Цей алгоритм використовується для виявлення/синтезування сигналу, що задовольняє одночасно кілька опуклих обмежень. Нехай fi — індикаторна функція на непорожній замкнутій опуклій множині Ci, що моделює обмеження. Це зводить задачу до задачі опуклої здійсненності (досяжності), в якій потрібно знайти розв'язок, що міститься в перетині всіх опуклих множин Ci. У методі проєктування в опуклі множини кожна множина Ci асоціюється з її проєктором PCi. Таким чином, на кожній ітерації x перераховується за формулою

xk+1=PC1PC2PCnxk

Проте поза такими задачами проєктори не підходять і потрібні оператори загальнішого вигляду. Серед різних узагальнень поняття опуклого проєктора проксимальні оператори найкраще підходять для таких цілей.

Визначення

Шаблон:Не перекладено опуклої функції f у точці x визначається як єдиний розв'язок

argminy(f(y)+12xy22)

і позначається як proxf(x).

proxf(x):NN

Зауважимо, що у випадку, коли f є індикаторною функцією ιC деякої опуклої множини C

proxιC(x)=argminy{12xy22yC+yC=argminyC12xy22=PC(x)

що показує, що проксимальний оператор справді є узагальненням проєктора.

Проксимальний оператор функції f описується включенням

p=proxf(x)xpf(p)((x,p)N×N)

Якщо f диференційовна, то наведене рівняння вище зводиться до

p=proxf(x)xp=f(p)((x,p)N×N)

Приклади

Окремими випадками проксимальних градієнтних методів є:

Див. також

Примітки

Шаблон:Reflist

Література

Посилання

Шаблон:Методи оптимізації

  1. Шаблон:Lang-en = найближчий