Розподіл Марченка–Пастура

Матеріал з testwiki
Перейти до навігації Перейти до пошуку
Графік розподілу Марченка-Пастура для різних значень лямбда

У математичній теорії випадкових матриць розподіл Марченка–Пастура, або закон Марченка–Пастура, описує асимптотичну поведінку сингулярних значень великих прямокутних випадкових матриць. Теорема названа на честь українських математиків Володимира Марченка та Леоніда Пастура, які довели цей результат у 1967 році.

Якщо X позначає a m×n випадкова матриця, елементи якої є незалежними однаково розподіленими випадковими величинами із середнім 0 і дисперсією σ2<, дозволяє

Yn=1nXXT

і нехай λ1,λ2,,λm бути власними значеннями Yn (розглядаються як випадкові змінні ). Нарешті, розглянемо випадкову міру

μm(A)=1m#{λjA},A.

підрахунок кількості власних значень у підмножині A включені в .

Теорема . Припустимо, що m,n так що співвідношення m/nλ(0,+) . Потім μmμ (у слабкій* топології в розподілі ), де

μ(A)={(11λ)𝟏0A+ν(A),if λ>1ν(A),if 0λ1,

і

dν(x)=12πσ2(λ+x)(xλ)λx𝟏x[λ,λ+]dx

з

λ±=σ2(1±λ)2.

Закон Марченка–Пастура також виникає як вільний закон Пуассона у вільній теорії ймовірностей, маючи швидкість 1/λ і величину стрибка σ2.

Кумулятивна функція розподілу

Використовуючи ті самі позначення, кумулятивна функція розподілу читається

Fλ(x)={λ1λ𝟏x[0,λ)+(λ12λ+F(x))𝟏x[λ,λ+)+𝟏x[λ+,),if λ>1F(x)𝟏x[λ,λ+)+𝟏x[λ+,),if 0λ1,

де F(x)=12πλ(πλ+σ2(λ+x)(xλ)(1+λ)arctanr(x)212r(x)+(1λ)arctanλr(x)2λ+2σ2(1λ)r(x)) і r(x)=λ+xxλ .

Деякі перетворення закону

Перетворення Коші (яке є негативним перетворенням Стілтьєса ), коли σ2=1, задається

Gμ(z)=z+λ1(zλ1)24λ2λz

Це дає R -перетворення:

Rμ(z)=11λz

Застосування до кореляційних матриць

При застосуванні до кореляційних матриць σ2=1 і λ=m/n маємо границі

λ±=(1±mn)2.

Тому часто припускають, що власні значення кореляційних матриць нижчі за λ+ є випадкові, а значення вищі за λ+ є значущими загальними факторами. Наприклад, отримання кореляційної матриці річного ряду (тобто 252 торгових днів) 10 прибутковостей акцій відобразить λ+=(1+10252)21.43 . З 10 власних значень кореляційної матриці лише значення вище 1,43 будуть вважатися значущими.

Джерела

Шаблон:Розподіли ймовірності