Експонента матриці

Матеріал з testwiki
Версія від 18:54, 29 вересня 2024, створена imported>Олюсь
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Експонента матриціматрична функція від квадратної матриці, що має багато властивостей аналогічних звичайній експоненційній функції дійсних чи комплексних чисел. Матрична експонента встановлює зв'язок між алгеброю Лі матриць і відповідною групою Лі.

Визначення

Для дійсної або комплексної матриці X розміру n×n (XM(n,)) експонента від X, що позначається як eX або exp(X) — матриця розміру n×n, визначена за допомогою ряду:

eX=k=01k!Xk,

де Xkk-а степінь матриці X.

Даний ряд завжди збігається абсолютно. Якщо X=α, де взято матричну норму узгоджену з векторною (для скінченновимірних просторів усі норми еквівалентні), то 1k!Xk1k!Xk1k!αk.

Звідси k=01k!Xkk=01k!Xkk=01k!αk=eα, що доводить абсолютну збіжність ряду і коректність визначення.

Якщо X — матриця розміру 1×1, то матрична експонента від X є матриця розмірності 1×1 , єдиний елемент якої дорівнює звичайній експоненті від єдиного елемента X.

Еквівалентне визначення

Експоненційну функцію можна також визначити наступною рівністю.

expX=limn(I+1nX)n, де Iодинична матриця відповідної розмірності.

Ця рівність є аналогічною до рівності ea=limn(1+an)n, що виконується для дійсних і комплексних чисел.

Для доведення рівності використовується формула (1+am)m=k=0makk!(mk)!, де a може бути як числом, так і матрицею.

Тоді якщо для тої ж норми, що й вище X=a, то:

eX(I+1nX)nk=0nakk!akk!(nk)!+k=n+1akk!=ea(1+an)n0, при n, що й доводить твердження.

Властивості

Основні властивості

Для комплексних матриць X і Y розміру n×n, довільних комплексних чисел a і b, одиничної матриці I і нульової матриці 0, експонента має наступні властивості:

Експонента суми

Для будь-яких двох дійсних чисел (скалярів) x і y експоненціальна функція задовольняє рівнянню ex+y=exey, це ж властивість має місце для симетричних матриць — якщо матриці X і Y комутують (тобто XY=YX), то exp(X+Y)=exp(X)exp(Y). Однак, для некомутативних матриць ця рівність виконується не завжди, в загальному випадку для обчислення exp(X+Y) використовується Шаблон:Нп5.

У загальному випадку з рівності exp(X+Y)=exp(X)exp(Y) не випливає, що X і Y комутують.

Для ермітових матриць існує дві прості теореми, пов'язані з слідом експонент матриць.

Нерівність Голдена - Томпсона

Якщо A і H — ермітові матриці, то [1]:

trexp(A+H)tr(exp(A)exp(H)),

де trXслід матриці X. Комутативність для виконання цього твердження не потрібна. Існують контрприклади, які показують, що нерівність Голдена — Томпсона не може бути узагальнена на три матриці, а tr(exp(A)exp(B)exp(C)) не завжди є дійсним числом для ермітових матриць A, B і C.

Теорема Ліба

Теорема Ліба, названа ім'ям Еліота Ліба, стверджує, що для фіксованої ермітової матриці H, функція:

f(A)=trexp(H+logA)

є увігнутою на конусі додатноозначених матриць [2].

Експоненціальне відображення

Експонента матриці завжди є невиродженою матрицею. Обернена до expX матриця рівна exp(X), це аналог того факту, що експонента від комплексного числа ніколи не дорівнює нулю. Таким чином, матрична експонента визначає відображення:

exp:Mn()GL(n,)

з простору всіх матриць розмірності n×n на загальну лінійну групу порядку n, тобто групу всіх невироджених матриць розмірності n×n. Це відображення є сюр'єкцією, тобто кожна невироджена матриця може бути записана як експонента від деякої іншої матриці (щоб це твердження було справедливим необхідно розглядати поле комплексних чисел , а не дійсних чисел ).

Для будь-яких двох матриць X і Y має місце нерівність

eX+YeXYeXeY,

де позначає довільну матричну норму. Звідси випливає, що експоненціальне відображення є неперервним і ліпшицевим на компактних підмножинах Mn().

Загалом експоненційне відображення не є ін'єктивним. Але воно буде ін'єктивним, наприклад на підмножині XB(0,ln2)M(n,),де B(0,ln2)— множина матриць норма яких (узгоджена з векторною нормою) менша ніж ln 2. На цій множині експоненційна функція є дифеоморфізмом і обернена функція може бути подана, як сума збіжного ряду:

log(Y)=k=1(1)k1k(YI)k.

Диференціювання

Відображення:

tetX,t

визначає гладку криву в загальній лінійній групі, яка проходить через одиничний елемент при t=0.

Похідна цього відображення визначається формулою:

ddtetX=XetX.

Справді з визначень похідної і властивостей експоненти одержується послідовність рівностей:

ddtetX=limt00e(t+t0)XetXt0=limt00et0XIt0etX=limt00(X+O(t0))etX=XetX.

Більш загально для матриці X(t) залежної від параметра t справедливою є рівність[3]:

ddteX(t)=eX1ead(X)ad(X)dXdt,

де ad(X):M(n,)M(n,)— лінійне відображення визначене ad(X)(Y)=[X,Y]=XYYX,для довільної матриці YM(n,).

У попередній формулі для виразу в правій частині справедлива формула:

1ead(X)ad(X)=k=0(1)k(k+1)!(ad(X))k.

Взявши в формулі для диференціювання X(t)=X+tY, отримуємо формулу для диференціала експоненційного відображення в точці XM(n,):

(dXexp)Y=expddteX+tY=eX1ead(X)ad(X)Y,YM(n,)TXM(n,).

При XY=YX ця рівність спрощується до (dXexp)Y=eXY.

Системи лінійних диференціальних рівнянь

Одна з причин, які зумовлюють важливість матричної експоненти, полягає в тому, що вона може бути використана для розв'язку систем звичайних диференціальних рівнянь [4]. Розв'язок системи:

ddty(t)=Ay(t),y(0)=y0,

де A — стала матриця, дається виразом:

y(t)=eAty0.

Матрична експонента може бути також використана для розв'язування неоднорідних рівнянь виду

ddty(t)=Ay(t)+z(t),y(0)=y0.

Не існує замкнутого аналітичного виразу для рішень неоднорідних диференціальних рівнянь виду

ddty(t)=A(t)y(t),y(0)=y0,

де A — матриця елементи якої не є константами, але Шаблон:Нп5 дозволяє отримати подання розв'язку у вигляді нескінченної суми.

Приклад однорідної системи

Для системи:

x=2xy+zy=3y1zz=2x+y+3z.

матриця рівна:

A=[211031213].

Можна показати, що експонента від матриці tA є

etA=12[e2t(1+e2t2t)2te2te2t(1+e2t)e2t(1+e2t2t)2(t+1)e2te2t(1+e2t)e2t(1+e2t+2t)2te2te2t(1+e2t)],

таким чином, загальним розв'язком цієї системи рівнянь є:

[xyz]=x(0)2[e2t(1+e2t2t)e2t(1+e2t2t)e2t(1+e2t+2t)]+y(0)2[2te2t2(t+1)e2t2te2t]+z(0)2[e2t(1+e2t)e2t(1+e2t)e2t(1+e2t)].

Приклад неоднорідної системи

Для розв'язку неоднорідної системи:

x=2xy+z+e2ty=3yzz=2x+y+3z+e2t

вводяться позначення:

A=[211031213],

і

𝐛=e2t[101]

Так як сума загального розв'язку однорідного рівняння і часткового розв'язку дають загальний розв'язок неоднорідного рівняння, залишається лише знайти частковий розв'язок. Так як:

𝐲p=etA0te(u)A[e2u0e2u]du+etA𝐜
𝐲p=etA0t[2eu2ue2u2ue2u02eU+2(u+1)e2u2(u+1)e2u02ue2u2ue2u2eu][e2u0e2u]du+etA𝐜
𝐲p=etA0t[e2u(2eu2ue2u)e2u(2eu+2(1+u)e2u)2e3u+2ue4u]du+etA𝐜
𝐲p=etA[124e3t(3et(4t1)16)124e3t(3et(4t+4)16)124e3t(3et(4t1)16)]+[2et2te2t2te2t02eT+2(t+1)e2t2(t+1)e2t02te2t2te2t2et][c1c2c3],

де 𝐜=𝐲p(0) — початкова умова.

Узагальнення: варіація довільної сталої

У разі неоднорідної системи можна використовувати метод варіації довільної сталої. Шукається частковий розв'язок у вигляді: 𝐲p(t)=exp(tA)𝐳(t):

𝐲p(t)=(etA)𝐳(t)+etA𝐳(t)=AetA𝐳(t)+etA𝐳(t)=A𝐲p(t)+etA𝐳(t).

Щоб 𝐲p була розв'язком, має виконуватися наступне:

etA𝐳(t)=𝐛(t)𝐳(t)=(etA)1𝐛(t)𝐳(t)=0teuA𝐛(u)du+𝐜.

Таким чином:

𝐲p(t)=etA0teuA𝐛(u)du+etA𝐜=0te(tu)A𝐛(u)du+etA𝐜,

де 𝐜 визначається з початкових умов задачі.

Див. також

Примітки

Шаблон:Примітки

Джерела

Посилання