Алгоритм Баума — Велша

Алгоритм Баума — Велша використовується в інформатиці та статистиці для знаходження невідомих параметрів прихованої марковської моделі (ПММ). Він використовує алгоритм прямого-зворотного ходу і є окремим випадком узагальненого EM-алгоритму.

Алгоритм Баума — Велша оцінки прихованої моделі Маркова

Прихована модель Маркова — це імовірнісна модель множини випадкових змінних ${Y_{1}, \dots, Y_{t}, Q_{1}, \dots, Q_{t}}$ . Змінні $Y_{t}$ — відомі дискретні спостереження, а $Q_{t}$ — «приховані» дискретні величини. В рамках прихованої моделі Маркова є два незалежних твердження, що забезпечують збіжність даного алгоритму:

$t$ — прихована змінна за відомих $(t - 1)$ змінних незалежна від усіх попередніх $(t - 1)$ змінних, тобто $P (Q_{t} ∣ Q_{t - 1}, Y_{t - 1}, \dots, Q_{1}, Y_{1}) = P (Q_{t} ∣ Q_{t - 1})$ ;
$t$ -е відоме спостереження залежить тільки від $t$ -го стану, тобто не залежить від часу, $P (Y_{t} ∣ Q_{t}, Q_{t - 1}, Y_{t - 1}, \dots, Q_{1}, Y_{1}) = P (Y_{t} ∣ Q_{t})$ .

Далі буде запропоновано алгоритм «припущень і максимізації» для пошуку максимальної ймовірнісної оцінки параметрів прихованої моделі Маркова за заданого набору спостережень. Цей алгоритм також відомий як алгоритм Баума — Велша.

$Q_{t}$ — це дискретна випадкова змінна, що набуває одного з $N$ значень $(1 \dots N)$ . Будемо вважати, що дана модель Маркова, визначена як $P (Q_{t} ∣ Q_{t - 1})$ , однорідна за часом, тобто незалежна від $t$ . Тоді можна задати $P (Q_{t} ∣ Q_{t - 1})$ як незалежну від часу стохастичну матрицю переміщень $A = {a_{i j}} = p (Q_{t} = j ∣ Q_{t - 1} = i)$ . Ймовірності станів у момент часу $t = 1$ визначаються початковим розподілом $π_{i} = P (Q_{1} = i)$ .

Будемо вважати, що ми в стані $j$ у момент часу $t$ , якщо $Q_{t} = j$ . Послідовність станів виражається як $q = (q_{1}, \dots, q_{T})$ , де $q_{t} \in {1 \dots N}$ є станом у момент $t$ .

Спостереження $Y_{t}$ в момент часу $t$ може мати одне з $L$ можливих значень, $y_{t} \in {o_{1}, \dots, o_{L}}$ . Імовірність заданого вектора спостережень у момент часу $t$ для стану $j$ визначається як $b_{j} (o_{i}) = P (Y_{t} = o_{i} ∣ Q_{t} = j)$ ( $B = {b_{i j}}$ — це матриця $L$ на $N$ ). Послідовність спостережень $y$ виражається як $y = (y_{1}, \dots, y_{T})$ .

Отже, ми можемо описати приховану модель Маркова за допомогою $λ = (A, B, π)$ . За заданого вектора спостережень $y$ алгоритм Баума — Велша знаходить $λ^{*} = a r g \max_{λ} P (y ∣ λ)$ . $λ^{*}$ максимізує ймовірність спостережень $y$ .

Алгоритм

Початкові дані: $λ = (A, B, π)$ з випадковими початковими умовами.

Алгоритм ітеративно оновлює параметр $λ$ до збігання в одній точці.

Пряма процедура

Позначимо через $α_{i} (t) = p (Y_{1} = y_{1}, \dots, Y_{t} = y_{t}, Q_{t} = i ∣ λ)$ ймовірність появи заданої послідовності $y_{1}, \dots, y_{t}$ для стану $i$ в момент часу $t$ .

$α_{i} (t)$ можна обчислити рекурсивно:

$α_{i} (1) = π_{i} \cdot b_{i} (y_{1});$
$α_{j} (t + 1) = b_{j} (y_{t + 1}) \sum_{i = 1}^{N} α_{i} (t) \cdot a_{i j} .$

Зворотна процедура

Дана процедура дозволяє обчислити $β_{i} (t) = p (Y_{t + 1} = y_{t + 1}, \dots, Y_{T} = y_{T} ∣ Q_{t} = i, λ)$ ймовірність кінцевої заданої послідовності $y_{t + 1}, \dots, y_{T}$ за умови, що ми почали з вихідного стану $i$ , в момент часу $t$ .

Можна обчислити $β_{i} (t)$ :

$β_{i} (T) = p (Y_{T} = y_{T} ∣ Q_{t} = i, λ) = 1;$
$β_{i} (t) = \sum_{j = 1}^{N} β_{j} (t + 1) a_{i j} b_{j} (y_{t + 1}) .$

Використовуючи $α$ і $β$ можна обчислити наступні значення:

$γ_{i} (t) \equiv p (Q_{t} = i ∣ y, λ) = \frac{α_{i} (t) β_{i} (t)}{\sum_{j = 1}^{N} α_{j} (t) β_{j} (t)},$
$ξ_{i j} (t) \equiv p (Q_{t} = i, Q_{t + 1} = j ∣ y, λ) = \frac{α_{i} (t) a_{i j} β_{j} (t + 1) b_{j} (y_{t + 1})}{\sum_{i = 1}^{N} \sum_{j = 1}^{N} α_{i} (t) a_{i j} β_{j} (t + 1) b_{j} (y_{t + 1})} .$

Маючи $γ$ і $ξ$ , Можна обчислити нові значення параметрів моделі:

${\bar{π}}_{i} = γ_{i} (1),$
${\bar{a}}_{i j} = \frac{\sum_{t = 1}^{T - 1} ξ_{i j} (t)}{\sum_{t = 1}^{T - 1} γ_{i} (t)},$
${\bar{b}}_{i} (o_{k}) = \frac{\sum_{t = 1}^{T} δ_{y_{t}, o_{k}} γ_{i} (t)}{\sum_{t = 1}^{T} γ_{i} (t)} .$ ,

де

δ_{y_{t}, o_{k}} = {\begin{matrix} 1 & якщо y_{t} = o_{k}, \\ 0 & інакше \end{matrix}

індикативна функція, і $b_{i}^{*} (o_{k})$ очікувана кількість значень спостережуваної величини, рівних $o_{k}$ в стані $i$ до загальної кількості станів $i$ .

Використовуючи нові значення $A$ , $B$ і $π$ , ітерації продовжуються до збігання.

Див. також

Алгоритм Вітербі

Джерела

Алгоритм Баума — Велша

Зміст

Алгоритм Баума — Велша оцінки прихованої моделі Маркова

Алгоритм

Пряма процедура

Зворотна процедура

Див. також

Джерела

Навігаційне меню

Алгоритм Баума — Велша

Алгоритм Баума — Велша оцінки прихованої моделі Маркова

Алгоритм

Пряма процедура

Зворотна процедура

Див. також

Джерела

Навігаційне меню

Пошук