EM-алгоритм

Шаблон:Машинне навчання EM-алгоритм (Шаблон:Lang-en) — алгоритм, що використовується в математичній статистиці для знаходження оцінок максимальної схожості параметрів ймовірних моделей, у випадку, коли модель залежить від деяких прихованих змінних. Кожна ітерація алгоритму складається з двох кроків. На E-кроці (expectation) вираховується очікуване значення функції правдоподібності, при цьому приховані змінні розглядаються як спостережувані. На M-кроці (maximization) вираховується оцінка максимальної схожості, таким чином збільшується очікувана схожість, вирахувана на E-кроці. Потім це значення використовується для E-кроку на наступній ітерації. Алгоритм виконується до збіжності.

Часто EM-алгоритм використовують для розділення суміші функції Гауса.

Опис алгоритму

Нехай $X$ — деяке з значень спостережуваних змінних, а $T$ — прихованні змінні. Разом $X$ і $T$ утворюють повний набір даних. Взагалі, $T$ може бути деякою підказкою, яка полегшує рішення проблеми у випадку, якщо вона відома. Наприклад, якщо є суміш розподілів, функція правдоподібності легко виражається через параметри відокремлених розподілів суміші.

Покладемо $p$ — густину імовірності (в безперервному випадку) або функція ймовірностей (в дискретному випадку) повного набору даних з параметрами $Θ$ : $p (𝐗, 𝐓 | Θ) .$ Цю функцію можна розуміти як правдоподібність всієї моделі, якщо розглядати її як функцію параметрів $Θ$ . Зауважимо, що умовний розподіл прихованої компоненти при деякому спостереженні та фіксованому наборі параметрів може бути вираженим так:

p (𝐓 | 𝐗, Θ) = \frac{p (𝐗, 𝐓 | Θ)}{p (𝐗 | Θ)} = \frac{p (𝐗 | 𝐓, Θ) p (𝐓 | Θ)}{\int p (𝐗 | \hat{𝐓}, Θ) p (\hat{𝐓} | Θ) d \hat{𝐓}}

,

використовуючи розширену формулу Байеса і формулу повної ймовірності. Таким чином, нам необхідно знати тільки розподіл спостережуваної компоненти при фіксованій прихованій $p (𝐗 | 𝐓, Θ)$ і ймовірності прихованих даних $p (𝐓 | Θ)$ .

EM-алгоритм ітеративно покращує початкову оцінку $Θ_{0}$ , обчислюючи нові значення оцінок $Θ_{1}, Θ_{2},$ і так далі. На кожному кроці перехід до $Θ_{n + 1}$ від $Θ_{n}$ виконується таким чином:

Θ_{n + 1} = \arg \max_{Θ} Q (Θ)

де $Q (Θ)$ — математичне сподівання логарифма правдоподібності. Іншими словами, ми не можемо відразу обчислити точну правдоподібність, але за відомими даними ( $X$ ) ми можемо знайти апостеріорну оцінку ймовірностей для різних значень прихованих змінних $T$ . Для кожного набору значень $T$ і параметрів $Θ$ ми можемо обчислити математичне сподівання функції правдоподібності з даного набору $X$ . Воно залежить від попереднього значення $Θ$ , бо це значення впливає на ймовірності прихованих змінних $T$ .

$Q (Θ)$ обчислюється таким чином:

Q (Θ) = E_{𝐓} [\log p (𝐗, 𝐓 | Θ) | 𝐗]

тобто умовне математичне сподівання $\log p (𝐗, 𝐓 | Θ)$ при умові $Θ$ .

Іншими словами, $Θ_{n + 1}$ — це значення, максимізуючи (M) умовне математичне сподівання (E) логарифма правдоподібності при даних значеннях спостережуваних змінних і попередньому значенні параметрів. У безперервному випадку значення $Q (Θ)$ вираховується так:

Q (Θ) = E_{𝐓} [\log p (𝐗, 𝐓 | Θ) | 𝐗] = \int_{- \infty}^{\infty} p (𝐓 | 𝐗, Θ_{n}) \log p (𝐗, 𝐓 | Θ) d 𝐓

Альтернативний опис

За певних обставин зручно розглядати EM-алгоритм як два чергуються кроку максимізації.^[1]^[2] Розглянемо функцію:

F (q, θ) = E_{q} [\log L (θ; x, Z)] + H (q) = - D_{KL} (q ‖ p_{Z | X} (\cdot | x; θ)) + \log L (θ; x)

де q — розподіл ймовірностей неспостережуваних змінних Z; p_Z|X(· |x;θ) — умовний розподіл неспостережуваних змінних при фіксованих спостережуваних x і параметрах розподілення ймовірностей неспостережуваних змінних θ; H — ентропія і D_KL — відстань Кульбака — Лейблера.

Тоді кроки EM-алгоритму можна показати як:

E(xpectation) крок: Вибираємо q, щоб максимізувати F:

q^{(t)} = * {a r g m a x}_{q} F (q, θ^{(t)})

M(aximization) крок: Вибираємо θ, щоб максимізувати F:

θ^{(t + 1)} = * {\arg m a x}_{θ} F (q^{(t)}, θ)

Примітки

Шаблон:Reflist

Посилання

[neal1999-1] Шаблон:Cite journal

[hastie2001-2] Шаблон:Cite book

[1]

[2]

EM-алгоритм

Зміст

Опис алгоритму

Альтернативний опис

Примітки

Посилання

Навігаційне меню

EM-алгоритм

Опис алгоритму

Альтернативний опис

Примітки

Посилання

Навігаційне меню

Пошук