Метод невизначених множників

Матеріал з testwiki
Перейти до навігації Перейти до пошуку
Знайти Шаблон:Mvar і Шаблон:Mvar, що максимізують Шаблон:Math за умови, що Шаблон:Math (показана червоним).

Шаблон:UniboxМетод невизначених множників або метод невизначених множників Лагранжа — метод знаходження умовного локального екстремуму, запропонований італійським математиком Жозефом-Луї Лагранжем. Метод дозволяє звести задачу з пошуку умовного екстремуму до задачі на знаходження безумовного екстремуму.

Задача

Нехай потрібно знайти екстремум функції n змінних F(x1,x2,,xn) за s умов

gi(x1,x2,,xn)=0, де i=1,2,,s.

Опис методу

Вводячи s невизначених множників Лагранжа λi, побудуємо функцію Лагранжа

Φ(x1,x2,,xn,λ1,λ2,,λs)=F(x1,x2,,xn)i=1sλigi(x1,x2,,xn).

Задача знаходження умовного оптимуму зводиться до розв'язування системи n+s рівнянь із n+s змінними:

Φ(x1,x2,,xn,λ1,λ2,,λs)xi=0,i=1,2,,n,
Φ(x1,x2,,xn,λ1,λ2,,λs)λj=gj(x1,x2,,xn)=0,j=1,2,,s.

Використання

Метод невизначених множників Лагранжа широко використовується в математичній і теоретичній фізиці. За допомогою цього методу отримані рівняння Лагранжа першого роду, які дозволяють формально ввести сили реакції в фізичні задачі із в'язями. Невизначені множники Лагранжа використовує також варіаційний метод в квантовій механіці.

Приклад

Приклад 1

Знайти прямокутник із найбільшою площею за заданого периметра p.

Розв'язок

Позначимо сторони прямокутника x та y. Потрібно знайти максимум функції

S=xy

за умови

2x+2y=p.

Вводимо множник Лагранжа λ і шукаємо безумовний екстремум функції

F(x,y,λ)=xyλ(2x+2yp)

Беручи похідні отримуємо систему рівнянь

F(x,y,λ)x=y2λ=0
F(x,y,λ)y=x2λ=0
F(x,y,λ)λ=2x+2yp=0

Підставляючи значення y=2λ та x=2λ в останнє рівняння, отримуємо

λ=p8
x=y=p4.
Smax=p216

Отже, найбільшу площу серед прямокутників із заданим периметром має квадрат.

Приклад 2

Ілюстрація задачі оптимізації з обмеженнями

Цей приклад вимагає складніших обчислень, але це все ще задача з одним обмеженням.

Припустимо, що потрібно знайти найбільші значення

f(x,y)=x2y

за умови, що x- і y-координати лежать на колі з центром в початку координат з радіусом 3. Тобто з таким обмеженням

g(x,y)=x2+y23=0.

Через те, що маємо лише одне обмеження, то маємо і лише один множник, скажімо λ.

Обмеження g(x,y) тотожна нулю на колі радіуса 3. Будь-яке кратне g(x,y) можна додати до g(x,y) не змінивши при цьому g(x,y) у цікавій нам області (на колі, що задовольняє наше обмеження).

(x,y,λ)=f(x,y)+λg(x,y)=x2y+λ(x2+y23).

звідки ми можемо порахувати градієнт:

x,y,λ(x,y,λ)=(x,y,λ)=(2xy+2λx,x2+2λy,x2+y23).

І отже:

x,y,λ(x,y,λ)=0{2xy+2λx=0x2+2λy=0x2+y23=0{x(y+λ)=0(i)x2=2λy(ii)x2+y2=3(iii)

(iii) це наше вихідне обмеження. (i) означає, що x=0 або λ=y. Якщо x=0 тоді з (iii) y=±3 і далі λ=0 з (ii). Якщо ж λ=y, підставляючи у (ii) маємо x2=2y2. Підставляючи у (iii) і розв'язуючи щодо y маємо y=±1. Отже існує шість критичних точок :

(2,1,1);(2,1,1);(2,1,1);(2,1,1);(0,3,0);(0,3,0).

Обчислюючи функцію мети в цих точках знаходимо, що

f(±2,1)=2;f(±2,1)=2;f(0,±3)=0.

Отже, функція мети досягає глобального максимуму (за умови обмеження) у (±2,1) і глобального мінімуму в (±2,1). Точка (0,3) це локальний мінімум f, а (0,3) це локальний максимум f, що можна побачити використавши обрамлену матрицю Гесе для (x,y,0).

Зауважте, що хоча (2,1,1) це критична точка , це не локальний екстремум . Маємо, що

(2+ε,1,1+δ)=2+δ(ε2+(22)ε).

Маючи будь-який окіл (2,1,1), можна вибрати мале додатне ε і мале δ будь-якого знаку, щоб отримати значення як більше так і менше ніж 2. Це можна також побачити з того, що матриця Гесе для обчислена в цій точці (та й в будь-якій іншій знайденій критичній точці) являє собою невизначену матрицю. Кожна з критичних точок це сідлова точка .

Див. також

Джерела