Опукла оптимізація

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

Шаблон:UniboxОпукла оптимізація — це підрозділ математичної оптимізації, котрий вивчає проблему мінімізації опуклих функцій над опуклими множинами. Багато класів задач з опуклою оптимізацією допускають поліноміальні алгоритми[1] тоді як математична оптимізація в цілому NP-важка[2][3][4].

Опукла оптимізація має застосування в широкому спектрі дисциплін, таких як автоматичні системи управління, оцінка та обробка сигналів, комунікації та мережі, проєктування електронних схем[5], аналіз та моделювання даних, фінанси, статистика (оптимальний експериментальний дизайн),[6] та структурна оптимізація, де концепція наближення виявилась ефективною.[5][7] З недавніми досягненнями в галузі обчислювальних та оптимізаційних алгоритмів, опукле програмування майже настільки ж просте, як і лінійне програмування[5].

Визначення

Проблема оптимізації опуклості — це проблема оптимізації, в якій цільова функція є опуклою функцією, а допустимою множиною є опукла множина. Функція f відображення деякої підмножини n в {±} опукла, якщо її домен опуклий і для всіх θ[0,1] і також для всіх x,y у своєму домені виконується така умова: f(θx+(1θ)y)θf(x)+(1θ)f(y). Множина S опукла, якщо для всіх членів x,yS і для всіх θ[0,1], у нас є, що θx+(1θ)yS.

Конкретно, проблема опуклої оптимізації — це проблема пошуку 𝐱C маючи

inf{f(𝐱):𝐱C},

де об'єктивна функція f є опуклою, як і допустима множина C[8][9]. Якщо така точка існує, вона називається оптимальною точкою ; множина всіх оптимальних точок називається оптимальною множиною. Якщо f є необмеженою внизу над C або мінімум не досягнуто, тоді, як кажуть, проблема оптимізації є необмеженою. Інакше, якщо C є порожньою множиною, тоді проблема, як кажуть, невирішувана[5].

Стандартна форма

Кажуть, що проблема опуклої оптимізації є в стандартній формі, якщо вона записана як

minimize𝐱f(𝐱)subject togi(𝐱)0,i=1,,mhi(𝐱)=0,i=1,,p,

де xn — змінна оптимізації, функції f,g1,,gm є опуклими, і функції h1,,hp є афінними[5]. У цьому позначенні функція f — це цільова функція задачі, і функції gi і hi називаються функціями обмеження. Можливим набором задачі оптимізації є множина, що складається з усіх точок xn задовольняючи g1(x)0,,gm(x)0 і h1(x)=0,,hp(x)=0. Ця множина є опуклою, оскільки підмножини опуклих функцій опуклі, афінні множини опуклі, а перетин опуклих множин — опуклий[5].

Багато проблем оптимізації можуть бути сформульовані в цій стандартній формі. Наприклад, проблема максимізації увігнутої функції f може бути переформульовано як проблема мінімізації опуклої функції f ; така проблема максимізації увігнутої функції над опуклою множиною часто називається проблемою оптимізації опуклої форми.

Властивості

Наступні корисні властивості задач опуклої оптимізації:[5][10]

Ці результати використовуються теорією опуклої мінімізації разом з геометричними поняттями функціонального аналізу (в просторах Гільберта), такими як теорема проєкції Гільберта, теорема розділення гіперплан та лема Фаркаса.

Приклади

Перелічені класи задач — це все задачі опуклої оптимізації, або їх можна звести до задачі опуклої оптимізації за допомогою простих перетворень:[5][11]

Ієрархія задач опуклої оптимізації. (LP: лінійна програма, QP: квадратична програма, програма конусів SOCP другого порядку, SDP: напіввизначена програма, CP: програма конуса.)

Множники Лагранжа

Розглянемо проблему мінімізації опуклої форми, задану в стандартній формі функцією витрат f(x) та обмеженням нерівності gi(x)0 для 1im. Домен 𝒳 є:

𝒳={xX|g1(x),,gm(x)0}.

Функцією Лагранжа для задачі є

L(x,λ0,λ1,,λm)=λ0f(x)+λ1g1(x)++λmgm(x).

Для кожної точки x в X що мінімізує f над X, існують реальні числа λ0,λ1,,λm, котрі називаються множниками Лагранжа, які одночасно задовольняють ці умови:

  1. x мінімізує L(y,λ0,λ1,,λm) над усім yX,
  2. λ0,λ1,,λm0, принаймні з одним λk>0,
  3. λ1g1(x)==λmgm(x)=0 (додаткова млявість).

Якщо існує «строго допустима точка», тобто точка z, котра задовольняє

g1(z),,gm(z)<0,

тоді твердження вище може вимагати λ0=1.

І навпаки, якщо якісь x в X задовольняють (1) — (3) для скалярів λ0,,λm з λ0=1, то x мінімізує f над X.

Алгоритми

Задачі опуклої оптимізації можуть бути розв'язані такими сучасними методами:[12]

Субградієнтні методи можуть бути реалізовані просто і тому широко застосовуються.[15] Подвійні субградієнтні методи — це субградієнтні методи, застосовані до подвійної задачі. Метод дрейфування плюс-штрафу схожий з методом подвійного субградієнта.

Розширення

Розширення опуклої оптимізації включають оптимізацію функцій двоопуклої, псевдоопуклої та квазіопуклої. Розширення теорії опуклого аналізу та ітеративних методів приблизно розв'язування задач мінімізації, що не є опуклими, відбуваються в області узагальненої опуклості, також відомої як абстрактний опуклий аналіз.

Див. також

Примітки

Шаблон:Примітки

Список літератури

Посилання

  1. 1,0 1,1 Шаблон:Harvnb
  2. Шаблон:Cite journal
  3. Sahni, S. "Computationally related problems, " in SIAM Journal on Computing, 3, 262—279, 1974.
  4. Quadratic programming with one negative eigenvalue is NP-hard, Panos M. Pardalos and Stephen A. Vavasis in Journal of Global Optimization, Volume 1, Number 1, 1991, pg.15-22.
  5. 5,0 5,1 5,2 5,3 5,4 5,5 5,6 5,7 Шаблон:Harvnb
  6. Chritensen/Klarbring, chpt. 4.
  7. Schmit, L.A.; Fleury, C. 1980: Structural synthesis by combining approximation concepts and dual methods.
  8. Шаблон:Cite book
  9. Шаблон:Cite book
  10. Шаблон:Cite journal
  11. Шаблон:Cite journal
  12. Для методів для опуклої мінімізації див. книги від Hiriart-Urruty і Lemaréchal, а також підручники від Ruszczyński і Bertsekas і від Boyd і Vandenberghe (внутрішня точка).
  13. Шаблон:Cite book
  14. Шаблон:Cite journal
  15. Bertsekas