Канонічна кореляція

Матеріал з testwiki
Версія від 02:25, 21 червня 2023, створена imported>BunykBot (автоматична заміна {{Не перекладено}} вікі-посиланнями на перекладені статті)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Шаблон:Машинне навчання У статистиці, каноні́чно-кореляці́йний ана́ліз (ККА, Шаблон:Lang-en) це спосіб виведення інформації зі Шаблон:Нп. Якщо ми маємо два вектори випадкових змінних, X = (X1, ..., Xn) та Y = (Y1, ..., Ym), та між цими змінними існують кореляції, то канонічно-кореляційний аналіз знайде такі лінійні комбінації Xi та Yj, які мають максимальну кореляцію між собою.[1] Т. Р. Кнапп зазначає, що «практично всі загальноприйняті Шаблон:Нп значущості можна розглядати як окремі випадки канонічно-кореляційного аналізу, що є загальною процедурою для дослідження взаємозв'язків між двома наборами змінних.»[2] Вперше цей метод було представлено Гарольдом Готелінґом 1936 року.[3]

Визначення

Для двох заданих стовпчикових векторів випадкових змінних зі скінченними другими моментами X=(x1,,xn) та Y=(y1,,ym) можна визначити взаємну коваріацію ΣXY=cov(X,Y) як матрицю n×m, чий (i,j)-тий елемент є коваріацією cov(xi,yj). На практиці ми б оцінювали коваріаційну матрицю на основі вибіркових даних з X та Y (тобто, з пари матриць даних).

Канонічно-кореляційний аналіз шукає таких векторів a та b, що випадкові змінні aX та bY максимізують кореляцію ρ=corr(aX,bY). Випадкові змінні U=aX та V=bY є першою парою канонічних змінних (Шаблон:Lang-en). Потім шукають векторів, які максимізують ту саму кореляцію, з обмеженням, що вони не корелюють з першою парою канонічних змінних; це дає другу пару канонічних змінних (Шаблон:Lang-en). Цю процедуру може бути продовжено аж до min{m,n} разів.

Обчислення

Виведення

Нехай ΣXX=cov(X,X), а ΣYY=cov(Y,Y). Параметром для максимізації є

ρ=aΣXYbaΣXXabΣYYb.

Першим кроком є визначення заміни базису та визначення

c=ΣXX1/2a,
d=ΣYY1/2b.

І відтак ми маємо

ρ=cΣXX1/2ΣXYΣYY1/2dccdd.

Згідно нерівності Коші — Буняковського, ми маємо

(cΣXX1/2ΣXYΣYY1/2)d(cΣXX1/2ΣXYΣYY1/2ΣYY1/2ΣYXΣXX1/2c)1/2(dd)1/2,
ρ(cΣXX1/2ΣXYΣYY1ΣYXΣXX1/2c)1/2(cc)1/2.

Рівність є тоді, коли вектори d та ΣYY1/2ΣYXΣXX1/2c є колінеарними. Крім того, максимум кореляції досягається тоді, коли c є власним вектором матриці ΣXX1/2ΣXYΣYY1ΣYXΣXX1/2 з максимальним власним значенням (див. відношення Релея). Подальші пари знаходять, використовуючи власні значення зменшуваної величини. Ортогональність гарантовано симетричністю кореляційних матриць.

Розв'язок

Отже, розв'язанням є:

  • c є власним вектором ΣXX1/2ΣXYΣYY1ΣYXΣXX1/2
  • d є пропорційним до ΣYY1/2ΣYXΣXX1/2c

Аналогічно,

  • d є власним вектором ΣYY1/2ΣYXΣXX1ΣXYΣYY1/2
  • c є пропорційним до ΣXX1/2ΣXYΣYY1/2d

Обертаючи зміну координат, отримуємо, що

  • a є власним вектором ΣXX1ΣXYΣYY1ΣYX
  • b є власним вектором ΣYY1ΣYXΣXX1ΣXY
  • a є пропорційним до ΣXX1ΣXYb
  • b є пропорційним до ΣYY1ΣYXa

Канонічні змінні визначаються як

U=cΣXX1/2X=aX
V=dΣYY1/2Y=bY

Реалізація

ККА може бути обчислювано із застосуванням сингулярного розкладу кореляційної матриці.[4] Він доступний як функція в[5]

Перевірка гіпотез

Кожен рядок може бути перевірено на значущість за допомогою наступного методу. Оскільки кореляції впорядковуються, то якщо сказати, що рядок i є нульовим, з цього випливатиме, що всі наступні кореляції також є нульовими. Якщо ми маємо в вибірці p незалежних спостережень, а ρ^i є оцінкою кореляції для i=1,,min{m,n}, то для i-того рядка статистичним критерієм є

χ2=(p112(m+n+1))lnj=imin{m,n}(1ρ^j2),

що для великих p асимптотично має розподіл хі-квадрат з (mi+1)(ni+1) ступенями вільності.[6] Оскільки всі кореляції від min{m,n} до p є логічно нульовими (і оцінюваними таким чином), то добуток членів після цієї точки не має значення.

Практичні застосування

Типовим застосуванням для канонічної кореляції в експериментальному контексті є брати два набори змінних, і дивитися, що є спільного між цими двома наборами. Наприклад, у психологічному тестуванні можна взяти два добре усталені багатовимірні Шаблон:Нп, такі як мінесотський багатопрофільний особистісний опитувальник (MMPI-2) та Шаблон:Нп. Дивлячись, як співвідносяться коефіцієнти MMPI-2 та NEO, можна отримати розуміння, які виміри були спільними для цих двох наборів, і скільки було спільної мінливості. Наприклад, можна було би з'ясувати, що виміри екстравертності та невротизму відповідальні за значну величину спільної мінливості цих двох наборів.

Канонічно-кореляційний аналіз також можна використовувати для вироблення рівняння моделі, яка пов'язує два набори змінних, наприклад, набір вимірів продуктивності та набір пояснювальних змінних, або набір виходів та набір входів. На таку модель може бути накладено обмеження, щоби забезпечити відображення нею теоретичних вимог або інтуїтивно очевидних умов. Цей тип моделі відомий як модель з максимальною кореляцією (Шаблон:Lang-en).[7]

Унаочнюють результати канонічної кореляції зазвичай за допомогою стовпчикових діаграм коефіцієнтів двох наборів змінних для пар канонічних Шаблон:Нп, що показують значущу кореляцію. Деякі автори вважають, що їх найкраще унаочнювати через геліографіки (Шаблон:Lang-en), круговий формат із променями як стовпчики, де кожна з половин представляє по набору змінних.[8]

Приклади

Нехай X=x1 з нульовим математичним сподіванням, тобто, E(X)=0. Якщо Y=X, тобто X та Y є повністю корельованими, то, наприклад, a=1 та b=1, і відтак першою (і єдиною в цьому прикладі) парою канонічних змінних є U=X та V=Y=X. Якщо Y=X, тобто X та Y є повністю антикорельованими, то, наприклад, a=1 та b=1, і відтак першою (і єдиною в цьому прикладі) парою канонічних змінних є U=X та V=Y=X. Зауважмо, що в обох випадках U=V, що показує, що канонічно-кореляційний аналіз трактує корельовані та антикорельовані змінні аналогічно.

Зв'язок із головними кутами

Виходячи з того, що X=(x1,,xn) та Y=(y1,,ym) мають нульові математичні сподівання, тобто E(X)=E(Y)=0, їхні коваріаційні матриці ΣXX=Cov(X,X)=E[XX] та ΣYY=Cov(Y,Y)=E[YY] можна розглядати як матриці Грама у внутрішньому добутку для елементів X та Y відповідно. В цій інтерпретації випадкові змінні, елементи xi з X та yj з Y, розглядають як елементи векторного простору з внутрішнім добутком, заданим коваріацією cov(xi,yj), див. Зв'язок коваріації з внутрішніми добутками.

Тоді визначення канонічних змінних U та V є рівнозначним визначенню Шаблон:Нп для пари підпросторів, породжуваних елементами X та Y по відношенню до цього внутрішньому добутку. Канонічні кореляції corr(U,V) дорівнюють косинусові Шаблон:Нп.

Див. також

Посилання

Примітки

Шаблон:Примітки

Шаблон:Статистика