Відношення Релея

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

У математиці для даної комплексної ермітової матриці M і ненульового вектора x відношення Релея[1] R(M,x) визначають так[2][3]:

R(M,x)=x*Mxx*x.

Для дійсних матриць умова ермітовості матриці зводиться до її симетричності, а ермітове спряження векторів x* перетворюється на звичайне транспонування x. Зауважте, що R(M,cx)=R(M,x) для будь-якої дійсної константи c0. Нагадаємо, що ермітова (як і симетрична дійсна) матриця має дійсні власні значення. Можна показати, що для матриці відношення Релея досягає мінімального значення λmin (найменше власне число матриці M) коли x дорівнює vmin (відповідний власний вектор). Так само можна показати, що R(M,x)λmax і R(M,vmax)=λmax. Відношення Релея використано в теоремі Куранта — Фішера про мінімакс для отримання всіх значень власних чиселШаблон:Sfn. Використовується воно і в алгоритмах знаходження власних значень матриці для отримання наближення власного значення з наближення власного вектора. А саме, відношення є базою для ітерацій з відношенням РелеяШаблон:SfnШаблон:Sfn.

Множину значень відношення Релея називають Шаблон:Не перекладеноШаблон:SfnШаблон:Sfn.

Окремий випадок коваріаційних матриць

Коваріаційну матрицю M для багатовимірної статистичної вибірки A (матриці спостережень) можна подати у вигляді добутку AAШаблон:SfnШаблон:Sfn. Як симетрична дійсна матриця, M має невід'ємні власні значення і ортогональні (або звідні до ортогональних) власні вектори.

По-перше, оскільки власні значення λi не від'ємні:

Mvi=AAvi=λivi
viAAvi=viλivi
Avi2=λivi2
λi=Avi2vi20

і, по-друге, оскільки власні вектори vi ортогональні один з одним:

Mvi=λivi
vjMvi=λivjvi
(Mvj)vi=λivjvi
λjvjvi=λivjvi
(λjλi)vjvi=0
vjvi=0, якщо власні значення різні; в разі однакових значень можна знайти ортогональний базис.

Тепер покажемо, що відношення Релея набуває найбільшого значення на векторі, відповідному найбільшому власному значенню. Розкладемо довільний вектор x за базисом власних векторів vj:

x=i=1nαivi, де αi=xvivivi=x,vivi2 є проєкцією x на vi

Отже, рівність

R(M,x)=xAAxxx

можна переписати так:

R(M,x)=(j=1nαjvj)AA(i=1nαivi)(j=1nαjvj)(i=1nαivi)

Оскільки власні вектори ортогональні, остання рівність перетворюється на

R(M,x)=i=1nαi2λii=1nαi2=i=1nλi(xvi)2(xx)(vivi)

Остання рівність показує, що відношення Релея є сумою квадратів косинусів кутів між вектором x і кожним з власних векторів vi, помножених на відповідне власне значення.

Якщо вектор x максимізує R(M,x), то всі вектори, отримані з x множенням на скаляр (kx для k0) також максимізують R. Таким чином, задачу можна звести до знаходження максимуму i=1nαi2λi за умови i=1nαi2=1.

Оскільки всі власні числа не від'ємні, задача зводиться до знаходження максимуму опуклої функція і можна показати, що він досягається при α1=1 і i>1,αi=0 (власні значення впорядковані за спаданням).

Таким чином, відношення Релея досягає максимуму на власному векторі, відповідному найбільшому власному значенню.

Той самий результат з використанням множників Лагранжа

Той самий результат можна отримати за допомогою множників Лагранжа. Задача полягає в знаходженні критичних точок функції

R(M,x)=xTMx,

за сталої величини x2=xTx=1. Тобто, потрібно знайти критичні точки функції

(x)=xTMxλ(xTx1),

де λ — множник Лагранжа.

Для стаціонарних точок функції (x) виконується рівність

d(x)dx=0
2xTMT2λxT=0
Mx=λx

і R(M,x)=xTMxxTx=λxTxxTx=λ.

Таким чином, власні вектори x1xn матриці M є критичними точками відношення Релея і їхні власні значення λ1λn — відповідними стаціонарними значеннями.

Ця властивість є базисом методу головних компонент і канонічної кореляції.

Використання в теорії Штурма — Ліувілля

Теорія Штурма — Ліувілля полягає в дослідженні лінійного оператора

L(y)=1w(x)(ddx[p(x)dydx]+q(x)y)

зі скалярним добутком

y1,y2=abw(x)y1(x)y2(x)dx,

де функції задовольняють деяким специфічним граничним умовам у точках a і b. Відношення Релея тут набуває вигляду

y,Lyy,y=aby(x)(ddx[p(x)dydx]+q(x)y(x))dxabw(x)y(x)2dx.

Іноді це відношення подають в еквівалентному вигляді, скориставшись інтегруванням частинамиШаблон:Sfn:

y,Lyy,y=aby(x)(ddx[p(x)y(x)])dx+abq(x)y(x)2dxabw(x)y(x)2dx
=y(x)[p(x)y(x)]|ab+aby(x)[p(x)y(x)]dx+abq(x)y(x)2dxabw(x)y(x)2dx
=p(x)y(x)y(x)|ab+ab[p(x)y(x)2+q(x)y(x)2]dxabw(x)y(x)2dx.

Узагальнення

Для будь-якої пари (A,B) дійсних симетричних додатноозначених матриць і ненульового вектора x, узагальнене відношення Релея визначається як

R(A,B;x):=xTAxxTBx.

Узагальнене відношення Релея можна звести до відношення Релея R(D,Cx) перетворенням D=C*1AC1, де C — розклад Холецького матриці B.

Див. також

Примітка

Шаблон:Reflist

Література

  1. також відоме під назвою відношення Релея — Ріца, названого на честь Вальтера Ріца і лорда Релея.
  2. Horn, R. A. and C. A. Johnson. 1985. Matrix Analysis. Cambridge University Press. pp. 176—180.
  3. Parlet B. N. The symmetric eigenvalue problem, SIAM, Classics in Applied Mathematics,1998