Градієнтні методи

Градієнтні методи — чисельні методи рішення з допомогою градієнта задач, що зводяться до знаходження екстремумів функції.

Постановка задачі розв'язання системи рівнянь в термінах методів оптимізації

Завдання рішення системи рівнянь:

${\begin{matrix} f_{1} (x_{1}, x_{2}, \dots, x_{n}) & = & 0 \\ \dots \\ f_{n} (x_{1}, x_{2}, \dots, x_{n}) & = & 0 \end{matrix}$ (1)

з $n$ $x_{1}, x_{2}, \dots, x_{n}$ еквівалентна задачі мінімізації функції

$F (x_{1}, x_{2}, \dots, x_{n}) \equiv \sum_{i = 1}^{n} | f_{i} (x_{1}, x_{2}, . . ., x_{n}) |^{2}$ (2)

або якій-небудь іншій зростаючій функції від абсолютних величин $| f_{i} |$ нев'язок (помилок) $f_{i} = f_{i} (x_{1}, x_{2}, \dots, x_{n})$ , $i = 1, 2, \dots, n$ . Завдання знаходження мінімуму (або максимуму) функції $n$ змінних і сама по собі має велике практичне значення.

Для вирішення цієї задачі ітераційними методами починають з довільних значень $x_{i}^{[0]} (i = 1, 2, . . ., n)$ і будують послідовні наближення:

${\vec{x}}^{[j + 1]} = {\vec{x}}^{[j]} + λ^{[j]} {\vec{v}}^{[j]}$

або покоординатно:

$x_{i}^{[j + 1]} = x_{i}^{[j]} + λ^{[j]} v_{i}^{[j]}, i = 1, 2, \dots, n, j = 0, 1, 2, \dots$ (3)

які зводяться до деякого рішенням ${\vec{x}}^{[k]}$ при $j \to \infty$ .

Різні методи відрізняються вибором «напрямку» для чергового кроку, тобто вибором відносин

$v_{1}^{[j]} : v_{2}^{[j]} : \dots : v_{n}^{[j]}$ .

Величина кроку (відстань, на яку треба піднятися в заданому напрямку в пошуках екстремуму) визначається значенням параметра $λ^{[j]}$ , який мінімізує величину $F (x_{1}^{[j + 1]}, x_{2}^{[j + 1]}, \dots, x_{n}^{[j + 1]})$ як функцію від $λ^{[j]}$ . Цю функцію зазвичай апроксимують її розкладанням у ряд Тейлора або інтерполяційним многочленом з трьох-п'яти вибраних значень $λ^{[j]}$ . Останній метод застосуємо для знаходження max і min таблично заданої функції $F (x_{1}, x_{2}, . . ., x_{n}) .$

Градієнтні методи

Основна ідея методів полягає в тому, щоб йти в напрямку найшвидшого спуску, а цей напрямок задається антиградієнтом $- \nabla F$ :

$\overset{[j + 1]}{\vec{x}} = \overset{[j]}{\vec{x}} - λ^{[j]} \nabla F (\overset{[j]}{\vec{x}})$

де $λ^{[j]}$ вибирається:

сталою, в цьому випадку метод може розходитися;
дробовим кроком, тобто довжина кроку в процесі спуску ділиться на деяке число;
якнайскорішим спуском: $λ^{[j]} = {a r g m i n}_{λ} F ({\vec{x}}^{[j]} - λ^{[j]} \nabla F ({\vec{x}}^{[j]}))$

Метод найшвидшого спуску (метод градієнта)

Вибирають $v_{i}^{[j]} = - \frac{\partial F}{\partial x_{i}}$ , де всі похідні обчислюються при $x_{i} = x_{i}^{[j]}$ , і зменшують довжину кроку $λ^{[j]}$ по мірі наближення до мінімуму функції $F$ .

Для аналітичних функцій $F$ і малих значень $f_{i}$ тейлорівський розклад $F (λ^{[j]})$ дозволяє вибрати оптимальну величину кроку

$λ^{[j]} = \frac{\sum_{k = 1}^{n} (\frac{\partial F}{\partial x_{k}})^{2}}{\sum_{k = 1}^{n} \sum_{h = 1}^{n} \frac{\partial^{2} F}{\partial x_{k} d x_{h}} \frac{\partial F}{\partial x_{k}} \frac{\partial F}{\partial x_{h}}}$ (5)

де всі похідні обчислюються при $x_{i} = x_{i}^{[j]}$ . Параболічна інтерполяція функції $F (λ^{[j]})$ може виявитися більш зручною.

Алгоритм

Задаються початкове наближення і точність розрахунку ${\vec{x}}^{0}, ϵ$
Розраховують $\overset{[j + 1]}{\vec{x}} = \overset{[j]}{\vec{x}} - λ^{[j]} \nabla F (\overset{[j]}{\vec{x}})$ , де $λ^{[j]} = {a r g m i n}_{λ} F ({\vec{x}}^{[j]} - λ^{[j]} \nabla F ({\vec{x}}^{[j]}))$
Перевіряють умову зупинки:
- Якщо $| {\vec{x}}^{[j + 1]} - {\vec{x}}^{[j]} | > ϵ$ , то $j = j + 1$ і перехід до кроку 2.
- Інакше $\vec{x} = {\vec{x}}^{[j + 1]}$ і зупинка.

Метод покоординатного спуску Гауса — Зейделя

Цей метод названий за аналогією з методом Гауса — Зейделя для розв'язання системи лінійних рівнянь. Покращує попередній метод за рахунок того, що на черговій ітерації спуск здійснюється поступово уздовж кожної з координат, однак тепер необхідно обчислювати нові $λ n$ раз за один крок.

Алгоритм

Задаються початкове наближення і точність розрахунку ${\vec{x}}_{0}^{0}, ε$
Розраховують ${\begin{matrix} {\vec{x}}_{1}^{[j]} & = & {\vec{x}}_{0}^{[j]} - λ_{1}^{[j]} \frac{\partial F ({\vec{x}}_{0}^{[j]})}{\partial x_{1}} {\vec{e}}_{1} \\ \dots \\ {\vec{x}}_{n}^{[j]} & = & {\vec{x}}_{n - 1}^{[j]} - λ_{n}^{[j]} \frac{\partial F ({\vec{x}}_{n - 1}^{[j]})}{\partial x_{n}} {\vec{e}}_{n} \end{matrix}$ , де $λ_{i}^{[j]} = {a r g m i n}_{λ} F ({\vec{x}}_{i - 1}^{[j]} - λ^{[j]} \frac{\partial F ({\vec{x}}_{i - 1}^{[j]})}{\partial x_{i}} {\vec{e}}_{i})$
Перевірють умову зупинки:
- Якщо $| {\vec{x}}_{n}^{[j]} - {\vec{x}}_{0}^{[j]} | > ε$ , то ${\vec{x}}_{0}^{[j + 1]} = {\vec{x}}_{n}^{[j]}, j = j + 1$ і перехід до кроку 2.
- Інакше $\vec{x} = {\vec{x}}_{n}^{[j]}$ і зупинка.

Метод спряжених градієнтів

Шаблон:Докладніше Метод спряжених градієнтів ґрунтується на поняттях прямого методу багатовимірної оптимізації — методу спряжених напрямів.

Застосування методу до квадратичних функцій $ℝ^{n}$ визначає мінімум за $n$ кроків.

Алгоритм

Задаються початковим наближенням і похибкою: ${\vec{x}}_{0}, ε, k = 0$
Розраховують початковий напрямок: $j = 0, {\vec{S}}_{k}^{j} = - \nabla f ({\vec{x}}_{k}), {\vec{x}}_{k}^{j} = {\vec{x}}_{k}$
x→kj+1=x→kj+λS→kj,λ=arg⁡minλf(x→kj+λS→kj),S→kj+1=−∇f(x→kj+1)+ωS→kj,ω=||∇f(x→kj+1)||2||∇f(x→kj)||2
- Якщо $| | {\vec{S}}_{k}^{j + 1} | | < ε$ або $| | {\vec{x}}_{k}^{j + 1} - {\vec{x}}_{k}^{j} | | < ε$ , то $\vec{x} = {\vec{x}}_{k}^{j + 1}$ і зупинка.
- Інакше
  - якщо $(j + 1) < n$ , то $j = j + 1$ і перехід до 3;
  - ${\vec{x}}_{k + 1} = {\vec{x}}_{k}^{j + 1}, k = k + 1$ і перехід до 2.

Див. також

Література

Шаблон:Методи оптимізації Шаблон:ВП-портали Шаблон:Math-stub Шаблон:Refimprove

Градієнтні методи

Зміст

Постановка задачі розв'язання системи рівнянь в термінах методів оптимізації

Градієнтні методи

Метод найшвидшого спуску (метод градієнта)

Алгоритм

Метод покоординатного спуску Гауса — Зейделя

Алгоритм

Метод спряжених градієнтів

Алгоритм

Див. також

Література

Навігаційне меню

Градієнтні методи

Постановка задачі розв'язання системи рівнянь в термінах методів оптимізації

Градієнтні методи

Метод найшвидшого спуску (метод градієнта)

Алгоритм

Метод покоординатного спуску Гауса — Зейделя

Алгоритм

Метод спряжених градієнтів

Алгоритм

Див. також

Література

Навігаційне меню

Пошук