Відношення Релея

У математиці для даної комплексної ермітової матриці $M$ і ненульового вектора $x$ відношення Релея^[1] $R (M, x)$ визначають так^[2]^[3]:

R (M, x) = \frac{x^{*} M x}{x^{*} x} .

Для дійсних матриць умова ермітовості матриці зводиться до її симетричності, а ермітове спряження векторів $x^{*}$ перетворюється на звичайне транспонування $x^{'}$ . Зауважте, що $R (M, c x) = R (M, x)$ для будь-якої дійсної константи $c \neq 0$ . Нагадаємо, що ермітова (як і симетрична дійсна) матриця має дійсні власні значення. Можна показати, що для матриці відношення Релея досягає мінімального значення $λ_{\min}$ (найменше власне число матриці $M$ ) коли $x$ дорівнює $v_{\min}$ (відповідний власний вектор). Так само можна показати, що $R (M, x) \leq λ_{\max}$ і $R (M, v_{\max}) = λ_{\max}$ . Відношення Релея використано в теоремі Куранта — Фішера про мінімакс для отримання всіх значень власних чиселШаблон:Sfn. Використовується воно і в алгоритмах знаходження власних значень матриці для отримання наближення власного значення з наближення власного вектора. А саме, відношення є базою для ітерацій з відношенням Релея Шаблон:Sfn Шаблон:Sfn.

Множину значень відношення Релея називають Шаблон:Не перекладено Шаблон:Sfn Шаблон:Sfn.

Окремий випадок коваріаційних матриць

Коваріаційну матрицю $M$ для багатовимірної статистичної вибірки $A$ (матриці спостережень) можна подати у вигляді добутку $A^{'} A$ Шаблон:Sfn Шаблон:Sfn. Як симетрична дійсна матриця, $M$ має невід'ємні власні значення і ортогональні (або звідні до ортогональних) власні вектори.

По-перше, оскільки власні значення $λ_{i}$ не від'ємні:

M v_{i} = A^{'} A v_{i} = λ_{i} v_{i}

\Rightarrow {v_{i}}^{'} A^{'} A v_{i} = {v_{i}}^{'} λ_{i} v_{i}

\Rightarrow {‖ A v_{i} ‖}^{2} = λ_{i} {‖ v_{i} ‖}^{2}

\Rightarrow λ_{i} = \frac{{‖ A v_{i} ‖}^{2}}{{‖ v_{i} ‖}^{2}} \geq 0

і, по-друге, оскільки власні вектори $v_{i}$ ортогональні один з одним:

M v_{i} = λ_{i} v_{i}

\Rightarrow {v_{j}}^{'} M v_{i} = λ_{i} {v_{j}}^{'} v_{i}

\Rightarrow (M v_{j})^{'} v_{i} = λ_{i} {v_{j}}^{'} v_{i}

\Rightarrow λ_{j} {v_{j}}^{'} v_{i} = λ_{i} {v_{j}}^{'} v_{i}

\Rightarrow (λ_{j} - λ_{i}) {v_{j}}^{'} v_{i} = 0

\Rightarrow {v_{j}}^{'} v_{i} = 0

, якщо власні значення різні; в разі однакових значень можна знайти ортогональний базис.

Тепер покажемо, що відношення Релея набуває найбільшого значення на векторі, відповідному найбільшому власному значенню. Розкладемо довільний вектор $x$ за базисом власних векторів $v_{j}$ :

x = \sum_{i = 1}^{n} α_{i} v_{i}

, де

α_{i} = \frac{x^{'} v_{i}}{{v_{i}}^{'} v_{i}} = \frac{⟨ x, v_{i} ⟩}{{‖ v_{i} ‖}^{2}}

є проєкцією

x

на

v_{i}

Отже, рівність

R (M, x) = \frac{x^{'} A^{'} A x}{x^{'} x}

можна переписати так:

R (M, x) = \frac{(\sum_{j = 1}^{n} α_{j} v_{j})^{'} A^{'} A (\sum_{i = 1}^{n} α_{i} v_{i})}{(\sum_{j = 1}^{n} α_{j} v_{j})^{'} (\sum_{i = 1}^{n} α_{i} v_{i})}

Оскільки власні вектори ортогональні, остання рівність перетворюється на

R (M, x) = \frac{\sum_{i = 1}^{n} α_{i}^{2} λ_{i}}{\sum_{i = 1}^{n} α_{i}^{2}} = \sum_{i = 1}^{n} λ_{i} \frac{(x^{'} v_{i})^{2}}{(x^{'} x) ({v_{i}}^{'} v_{i})}

Остання рівність показує, що відношення Релея є сумою квадратів косинусів кутів між вектором $x$ і кожним з власних векторів $v_{i}$ , помножених на відповідне власне значення.

Якщо вектор $x$ максимізує $R (M, x)$ , то всі вектори, отримані з $x$ множенням на скаляр ( $k x$ для $k \neq 0$ ) також максимізують $R$ . Таким чином, задачу можна звести до знаходження максимуму $\sum_{i = 1}^{n} α_{i}^{2} λ_{i}$ за умови $\sum_{i = 1}^{n} α_{i}^{2} = 1$ .

Оскільки всі власні числа не від'ємні, задача зводиться до знаходження максимуму опуклої функція і можна показати, що він досягається при $α_{1} = 1$ і $\forall i > 1, α_{i} = 0$ (власні значення впорядковані за спаданням).

Таким чином, відношення Релея досягає максимуму на власному векторі, відповідному найбільшому власному значенню.

Той самий результат з використанням множників Лагранжа

Той самий результат можна отримати за допомогою множників Лагранжа. Задача полягає в знаходженні критичних точок функції

R (M, x) = x^{T} M x

,

за сталої величини $‖ x ‖^{2} = x^{T} x = 1.$ Тобто, потрібно знайти критичні точки функції

ℒ (x) = x^{T} M x - λ (x^{T} x - 1),

де $λ$ — множник Лагранжа.

Для стаціонарних точок функції $ℒ (x)$ виконується рівність

\frac{d ℒ (x)}{d x} = 0

∴ 2 x^{T} M^{T} - 2 λ x^{T} = 0

∴ M x = λ x

і $R (M, x) = \frac{x^{T} M x}{x^{T} x} = λ \frac{x^{T} x}{x^{T} x} = λ .$

Таким чином, власні вектори $x_{1} \dots x_{n}$ матриці $M$ є критичними точками відношення Релея і їхні власні значення $λ_{1} \dots λ_{n}$ — відповідними стаціонарними значеннями.

Ця властивість є базисом методу головних компонент і канонічної кореляції.

Використання в теорії Штурма — Ліувілля

Теорія Штурма — Ліувілля полягає в дослідженні лінійного оператора

L (y) = \frac{1}{w (x)} (- \frac{d}{d x} [p (x) \frac{d y}{d x}] + q (x) y)

зі скалярним добутком

⟨ y_{1}, y_{2} ⟩ = \int_{a}^{b} w (x) y_{1} (x) y_{2} (x) d x

,

де функції задовольняють деяким специфічним граничним умовам у точках $a$ і $b$ . Відношення Релея тут набуває вигляду

\frac{⟨ y, L y ⟩}{⟨ y, y ⟩} = \frac{\int_{a}^{b} y (x) (- \frac{d}{d x} [p (x) \frac{d y}{d x}] + q (x) y (x)) d x}{\int_{a}^{b} w (x) y (x)^{2} d x} .

Іноді це відношення подають в еквівалентному вигляді, скориставшись інтегруванням частинами Шаблон:Sfn:

\frac{⟨ y, L y ⟩}{⟨ y, y ⟩} = \frac{\int_{a}^{b} y (x) (- \frac{d}{d x} [p (x) y^{'} (x)]) d x + \int_{a}^{b} q (x) y (x)^{2} d x}{\int_{a}^{b} w (x) y (x)^{2} d x}

= \frac{- y (x) [p (x) y^{'} (x)] |_{a}^{b} + \int_{a}^{b} y^{'} (x) [p (x) y^{'} (x)] d x + \int_{a}^{b} q (x) y (x)^{2} d x}{\int_{a}^{b} w (x) y (x)^{2} d x}

= \frac{- p (x) y (x) y^{'} (x) |_{a}^{b} + \int_{a}^{b} [p (x) y^{'} (x)^{2} + q (x) y (x)^{2}] d x}{\int_{a}^{b} w (x) y (x)^{2} d x} .

Узагальнення

Для будь-якої пари $(A, B)$ дійсних симетричних додатноозначених матриць і ненульового вектора $x$ , узагальнене відношення Релея визначається як

R (A, B; x) := \frac{x^{T} A x}{x^{T} B x} .

Узагальнене відношення Релея можна звести до відношення Релея $R (D, C x)$ перетворенням $D = {C^{*}}^{- 1} A C^{- 1}$ , де $C$ — розклад Холецького матриці $B$ .

Див. також

Шаблон:Не перекладено

Примітка

Шаблон:Reflist

Література

↑ також відоме під назвою відношення Релея — Ріца, названого на честь Вальтера Ріца і лорда Релея.
↑ Horn, R. A. and C. A. Johnson. 1985. Matrix Analysis. Cambridge University Press. pp. 176—180.
↑ Parlet B. N. The symmetric eigenvalue problem, SIAM, Classics in Applied Mathematics,1998

[1] також відоме під назвою відношення Релея — Ріца, названого на честь Вальтера Ріца і лорда Релея.

[2] Horn, R. A. and C. A. Johnson. 1985. Matrix Analysis. Cambridge University Press. pp. 176—180.

[3] Parlet B. N. The symmetric eigenvalue problem, SIAM, Classics in Applied Mathematics,1998

[1]

[2]

[3]

Відношення Релея

Зміст

Окремий випадок коваріаційних матриць

Той самий результат з використанням множників Лагранжа

Використання в теорії Штурма — Ліувілля

Узагальнення

Див. також

Примітка

Література

Навігаційне меню

Відношення Релея

Окремий випадок коваріаційних матриць

Той самий результат з використанням множників Лагранжа

Використання в теорії Штурма — Ліувілля

Узагальнення

Див. також

Примітка

Література

Навігаційне меню

Пошук