Матриця Гессе

Матеріал з testwiki
Версія від 10:33, 3 лютого 2025, створена imported>Олюсь
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Шаблон:Числення Матриця Гессеквадратна матриця елементами якої є часткові похідні деякої функції. Це поняття запровадив Людвіг Отто Гессе (1844), використовуючи іншу назву. Термін «матриця Гессе» належить Джеймсу Джозефу Сильвестрові.

Визначення

Формально, нехай дано дійсну функцію від n змінних:

f(x1,x2,,xn),

якщо у функції f існують всі похідні другого порядку, то можна визначити матрицю Гессе для цієї функції:

H(f)ij(x)=2fxixj

де x=(x1,x2,...,xn), тобто H(f)=[2fx122fx1x22fx1xn2fx2x12fx222fx2xn2fxnx12fxnx22fxn2].

Визначник цієї матриці називається визначником Гессе, або гесіаном.

Значення матриці Гессе пояснюється її появою у формулі Тейлора:

y=f(𝐱+Δ𝐱)f(𝐱)+J(𝐱)Δ𝐱+12Δ𝐱TH(𝐱)Δ𝐱

Матриці Гессе використовуються в задачах оптимізації методом Ньютона. Повне обчислення матриці Гессе може бути досить складним, тому були розроблені квазіньютонові алгоритми, засновані на наближених виразах для матриці Гессе. Найвідоміший з них — алгоритм Бройдена — Флетчера — Гольдфарба — Шанно.

Симетрія матриці Гессе

Мішані похідні функції f — це елементи матриці Гессе, що стоять не на головній діагоналі. Якщо вони неперервні, то порядок диференціювання не важливий:

x(fy)=y(fx).

Це можна також записати як

fyx=fxy.

В цьому випадку матриця Гессе є симетричною.

Критичні точки функції

Шаблон:Main

Якщо градієнт f (її векторна похідна) рівний нулю в деякій точці x0, то ця точка називається критичною.

Обрамлена матриця Гессе

У випадку оптимізації з додатковими умовами виникає також поняття обрамленої матриці Гессе. Нехай знову маємо функцію:

f(x1,x2,,xn),

але тепер також розглянемо умови:

gi(x1,x2,,xn)=0,1im,m<n

При оптимізації функції f з додатковими умовами обрамлена матриця Гессе має вигляд:

H(f,g)=[00g1x1g1x2g1xn00gmx1gmx2gmxng1x1gmx12fx122fx1x22fx1xng1x2gmx22fx2x12fx222fx2xng1xngmxn2fxnx12fxnx22fxn2]

Для даної матриці можна сформувати різні головні мінори. Позначимо |Hi(f,g)|,2in — головний мінор матриці, для якого останнім елементом на головній діагоналі є 2fxi2. Тоді можна сформувати достатні умови екстремуму для функції при виконанні обмежень.

Функція буде мати максимум при виконанні умов, якщо знаки послідовних n - m мінорів |Hi(f,g)|,m+1in, будуть чергуватися, при чому знак |Hi(f,g)| буде рівний (1)m+1.

Функція буде мати мінімум при виконанні умов, всі послідовні n - m мінорів |Hi(f,g)|,m+1in, мають один знак, а саме (1)m.

Варіації і узагальнення

Якщо f — векторзначна функція, тобто

f=(f1,f2,fn),

то її другі часткові похідні утворюють не матрицю, а тензор рангу n+1.

Література