Теорема Карунена — Лоева

Матеріал з testwiki
Версія від 14:12, 19 лютого 2024, створена imported>A.sav (clean up, replaced: він він → він за допомогою AWB)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Шаблон:Вичитати Теорема Кархунена — Лоева (названа на честь Шаблон:Нп та Шаблон:Нп), також відома як теорема Косамбі — Кархунена — Лоева[1][2], це розклад випадкового процесу у вигляді нескінченної лінійної комбінації ортогональних функцій, що є аналогом представлення функції в ряд Фур'є на обмеженому інтервалі. Цей розклад тісно пов'язаний з методом головних компонент (PCA), який широко використовується в аналізі даних.[3]

Першим хто розглянув розклад випадкового процесу у вигляді нескінченного ряду Дамодаром Дхарманандою Косамбі[4][5]. Існує декілька розкладів стохастичного процесу: якщо процес заіндексований над [a,b], то будь-який ортонормований базис в L2[a,b] задає розклад в цій формі. Важливість теореми Кархунена – Лоева полягає в тому, що вона дає найкращий базис у сенсі мінімізації середньої квадратичної помилки.

На відміну від ряду Фур'є, де коефіцієнти є фіксованими числами і базис складається з синусоїдальних функцій (тобто функцій синуса та косинуса), коефіцієнти в теоремі Кархунена – Лоева є випадковими величинами, а базис розкладання залежить від процесу. Фактично, ортогональні базисні функції, що використовуються в цьому розкладі, визначаються коваріаційною функцією процесу.

У випадку центрованого випадкового процесу {Xt}t[a,b] (центрований означає 𝐄[Xt]=0 для всіх t[a,b]), що задовольняє умову технічної неперервності, X допускає розкладання

Xt=k=1Zkek(t),

де Zk є попарно некорельованими випадковими величинами, а функції ek є неперервними дійсними функціями на [a,b], які є попарно ортогональними в L2[a,b]. Загальний випадок процесу Xt, який не є центрованим, можна повернути до випадку центрованого процесу, розглядаючи Xt𝐄[Xt], який є центрованим процесом.

Крім того, у випадку нормального процесу, випадкові величини Zk є нормально розподіленими і стохастично незалежними. Цей результат узагальнює перетворення Кархунена – Лоева. Важливим прикладом центрованого стохастичного процесу на [0,1] є процес Вінера; теорема Кархунена – Лоева може бути використана для забезпечення канонічного ортогонального представлення для нього. У цьому випадку розкладання складається з синусоїдальних функцій.

Формулювання

  • У цій статті ми розглядатимемо квадратично інтегрований випадковий процес Xt із нульовим середнім, визначений у ймовірнісному просторі (Ω,F,𝐏 та проіндексований у замкненому інтервалі [a,b] з коваріаційною функцією KX(s,t). Таким чином ми маємо:
t[a,b]XtL2(Ω,F,𝐏),t[a,b]𝐄[Xt]=0,t,s[a,b]KX(s,t)=𝐄[XsXt].
TKX:L2([a,b])L2([a,b]),fTKXf=abKX(s,)f(s)ds.

Оскільки TKX є лінійним оператором, то має сенс говорити про його власні значення λk та власні функції ek, які знаходяться за допомогою розв'язування однорідного інтегрального рівняння Фредгольма другого роду

abKX(s,t)ek(s)ds=λkek(t)

Формулювання теореми

Теорема. Нехай Xt— квадратично інтегрований випадковий процес, визначений у ймовірносному просторі (Ω,F,𝐏) та проіндексований на інтервалі [a,b], з неперервною коваріаційною функцією KX(s,t).

Тоді KX(s,t) є ядром Мерсера, і якщо ek ортонормований базис в L2[a,b] утворений власними функціями TKX з відповідними власними значеннями λk допускає наступне представлення

Xt=k=1Zkek(t),

де збіжність в L2, рівномірна по t і

Zk=abXtek(t)dt

Крім того, випадкові величини некорельовані Zk мають нульове середнє та мають дисперсію λk

𝐄[Zk]=0,kand𝐄[ZiZj]=δijλj,i,j

Зауважте, що за допомогою узагальнення теореми Мерсера, ми можемо замінити інтервал [a,b] на будь-який компактний простір C і міру Лебега на [a,b], носієм якої є C.

Доведення

  • Коваріаційна функція KX є ядром Мерсера. Згідно з теоремою Мерсера, отже, існує набір λk, ek(t) власних значень і власних функцій TKX що утворюють ортонормований базис L2[a,b], і KX можна розкласти
KX(s,t)=k=1λkek(s)ek(t)
  • Процес Xt можна розкласти за власними функціями ek(t) як:
Xt=k=1Zkek(t)
де коефіцієнти (випадкові величини) Zk є проекціями Xt на відповідні власні функції
Zk=abXtek(t)dt
  • Тоді ми можемо отримати
𝐄[Zk]=𝐄[abXtek(t)dt]=ab𝐄[Xt]ek(t)dt=0[8pt]𝐄[ZiZj]=𝐄[ababXtXsej(t)ei(s)dtds]=abab𝐄[XtXs]ej(t)ei(s)dtds=ababKX(s,t)ej(t)ei(s)dtds=abei(s)(abKX(s,t)ej(t)dt)ds=λjabei(s)ej(s)ds=δijλj
де ми використали факт, що ek є власними функціями TKX і ортонормовані.
  • Тепер покажемо, що збіжність відбувається в L2. Нехай
SN=k=1NZkek(t).
Тоді:
𝐄[|XtSN|2]=𝐄[Xt2]+𝐄[SN2]2𝐄[XtSN]=KX(t,t)+𝐄[k=1Nl=1NZkZek(t)e(t)]2𝐄[Xtk=1NZkek(t)]=KX(t,t)+k=1Nλkek(t)22𝐄[k=1NabXtXsek(s)ek(t)ds]=KX(t,t)k=1Nλkek(t)2
яка дорівнює 0 за теоремою Мерсера.

Властивості перетворення Кархунена – Лоева

Особливий випадок: розподіл Гауса

Оскільки ліміт в середньому спільно гаусівських випадкових величин є спільно гаусівською, а спільно гауссові випадкові (центровані) величини є незалежними, тоді і тільки тоді, коли вони ортогональні, ми також можемо зробити висновок:

Теорема. Змінні Шаблон:Mvar мають спільний гаусівський розподіл і є незалежними, якщо процес {Xt} є гаусівським.

У випадку гаусової випадкової величини, змінні Шаблон:Mvar є незалежними, ми можемо сказати більше:

limNi=1Nei(t)Zi(ω)=Xt(ω)

Лінійне наближення Теорема Кархунена — Лоева

Розглянемо слас сигналів які ми хочемо наблизити за допомогою M базисних веторів. Ці сигнали змодельовані як реалізація випадкови веторів Y[n] розміром N. Для оптимізації апроксимації ми реалізуємо такий базис що зменить помилку. Ця секція доводить, що накращий базис це базисКархунена — Лоева що діагоналізує Y. Випадковий вектор Y може бути декомпонований в ортонормальний базис

{gm}0mN

а саме:

Y=m=0N1Y,gmgm,

де кожен

Y,gm=n=0N1Y[n]gm*[n]

це випадкова величина. Наближення перших M<N векторів базиса є

YM=m=0M1Y,gmgm

Із береження енергії в ортогональному базисі виходить

ε[M]=𝐄{YYM2}=m=MN1𝐄{|Y,gm|2}

Це помилка пов'язана з коваріацією Y визначена як

R[n,m]=𝐄{Y[n]Y*[m]}

Для будь-якого вектору X[n] ми визначимо K коваріаційний оператор визначений за матрицею,

𝐄{|Y,x|2}=Kx,x=n=0N1m=0N1R[n,m]x[n]x*[m]

Помилка ε[M] це сума останніх NM коефіціентів коваріаційного оператору

ε[M]=m=MN1Kgm,gm

Коваріаційний оператор K Ермітів і позитивний тому він може бути діагоналзований, в ортогональному базисі який називається базис Кархунена — Лоева. Наступна теорема стверджує, що базис Кархунена — Лоева має найменшу посику апроксимізації.

Theorem (Оптимальність Кархунена — Лоева базиса). Нехай Шаблон:Mvar коваріаційний оператор. Для всіх Шаблон:Math, помилка апроксимації

ε[M]=m=MN1Kgm,gm

приймає мінімальне значення тоді і тільки тоді

{gm}0m<N

це базис Кархунена — Лоева відсортовонаний по зменшенню власних чисел.

Kgm,gmKgm+1,gm+1,0m<N1.

Приклади

Вінерівський процес

Існує декілька еквівалентних формулювань процес Вінера яка є узагальненням Броунівського руху. Тут ми розглядаєм стандартний гаусівський процесс Wt з коваріаційною функцією

KW(t,s)=cov(Wt,Ws)=min(s,t).

Ми можемо розглядаєио лише інтервал [a,b]=[0,1].

Ми можемо легко порахувати власні вектори, а саме

ek(t)=2sin((k12)πt)

і відвідні власні числа

λk=1(k12)2π2.

Щоб знайти власні числа та власні інтеграли ми маємо вирішити інтегральні рівняння

abKW(s,t)e(s)ds=λe(t)t,0t101min(s,t)e(s)ds=λe(t)t,0t10tse(s)ds+tt1e(s)ds=λe(t)t,0t1

якщо ми продиференціюємо по t, то ми отримаємо:

t1e(s)ds=λe(t)

після другого дифференціювання ми отримаємо аступне диффиренційне рівняння:

e(t)=λe(t)

Загальний розв'язок дифференціального рівнняння виглядає так:

e(t)=Asin(tλ)+Bcos(tλ)

A і B - дві константи, які визначаються з граничних умов. При підставленні t=0 в інтегральне рівняння ми отримаємо e(0)=0 з чого також отримаємо B=0 та, також, при t=1 перше диффернціювання дає e(1)=0:

cos(1λ)=0

з чого ми отримаємо загальний вигляд власних чисел TKX are:

λk=(1(k12)π)2,k1

Відповідні власні функції мають вигляд:

ek(t)=Asin((k12)πt),k1

A обрана так, щоб нормалізувати ek:

01ek2(t)dt=1A=2

Ми отримаємо представлення процесу Вінера

Theorem. Існує послідовність {Zi} незалежних Гасових випадкових величин з нульовим середнім та дисперсією 1 так щ

Wt=2k=1Zksin((k12)πt)(k12)π.

Треба зауважити що таке представлення дійсне при t[0,1]. На більшихих інтервалах інкременти не незалежні. Як сказано в теоремі, збіжність у L2 нормі і рівномірна по  t.

Броунівський міст

Подібно Броунівський міст Bt=WttW1 який є випадковим процесом з коваріацією

KB(t,s)=min(t,s)ts

може бути представлений як ряд

Bt=k=1Zk2sin(kπt)kπ

Примітки

Шаблон:Reflist

Посилання