Тензорний скетч

Матеріал з testwiki
Версія від 17:27, 14 листопада 2024, створена imported>InternetArchiveBot (Виправлено джерел: 1; позначено як недійсні: 0.) #IABot (v2.0.9.5)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Шаблон:Машинне навчання

Тензорний скетч (Шаблон:Lang-en) — метод зменшення розмірності, що використовується у статистиці, машинному навчанні та алгоритмах обробки великих даних[1][2]. Він особливо ефективний стосовно векторів з тензорною структурою. Тензорний скетч може бути використаний для прискорення білінійного поєднання в нейронних мережах і застосовується у багатьох алгоритмах чисельної лінійної алгебри[3].

Історія

Термін тензорний скетч (ескіз) був придуманий у 2013 році[4] й описаний як метод того ж року Расмусом Пегом[5].

Спочатку відповідний метод спирався на використання швидкого перетворення Фур'є, щоб зробити швидку згортку. Пізніші науково-дослідні роботи узагальнили його до значно більшого класу методів зменшення розмірності за допомогою випадкових тензорних проєкцій.

Тензорні проєкції

В основі одного з ефективних варіантів тензорного скетча лежить використання торцевого добутку матриць, запропонованого Слюсарем В. І.[6] в 1996 р. (Шаблон:Lang-en)[7][8][9][10][11].

Торцевий добуток двох матриць з однаковою кількістю рядків 𝐂3×2 та 𝐃3×2 позначається 𝐂𝐃[7][8][9][12] і має вид: 𝐂𝐃=[𝐂1𝐃1𝐂2𝐃2𝐂3𝐃3]=[𝐂1,1𝐃1,1𝐂1,1𝐃1,2𝐂1,2𝐃1,1𝐂1,2𝐃1,2𝐂1,3𝐃1,1𝐂1,3𝐃1,2𝐂2,1𝐃2,1𝐂2,1𝐃2,2𝐂2,2𝐃2,1𝐂2,2𝐃2,2𝐂2,3𝐃2,1𝐂2,3𝐃2,2𝐂3,1𝐃3,1𝐂3,1𝐃3,2𝐂3,2𝐃3,1𝐂3,2𝐃3,2𝐂3,3𝐃3,1𝐂3,3𝐃3,2].

Тензорний скетч може використовуватися для зменшення кількості змінних, необхідних для реалізації білінійного пулінгу в нейронній мережі

Доцільність використання цього добутку полягає у його властивості:

(𝐂𝐃)(xy)=𝐂x𝐃y=[(𝐂x)1(𝐃y)1(𝐂x)2(𝐃y)2],

де  — поелементний добуток Адамара.

На цій основі довільний тензорний скетч виду 𝐌(yz) можливо подати як 𝐌y𝐌z, де матриці 𝐌 та 𝐌 мають менший розмір, і 𝐌=𝐌𝐌. Оскільки операції матрично-векторних добутків 𝐌y і 𝐌z обчислюються за лінійним часом kd1 та kd2 відповідно, перехід до представлення 𝐌𝐌 дозволяє виконати множення на вектори тензорної структури набагато швидше, чим формується вихідний вираз 𝐌(yz), а саме за час kd=kd1d2.

Для тензорів більш високого порядку, наприклад, x=yzt, економія буде ще більш значною.

Подібне перетворення задовольняє лемі Джонсона-Лінденштрауса про малі викривлення вихідних даних великої розмірності.

Див. також

Примітки

Шаблон:Reflist

Шаблон:Бібліоінформація Шаблон:Штучний інтелект

  1. Шаблон:Cite web Шаблон:Webarchive
  2. Шаблон:Cite web
  3. Woodruff, David P. «Sketching as a Tool for Numerical Linear Algebra.» Theoretical Computer Science 10.1-2 (2014): 1–157.
  4. Шаблон:Cite conference
  5. Шаблон:Cite journal
  6. Anna Esteve, Eva Boj & Josep Fortiana (2009): Interaction Terms in Distance-Based Regression, Communications in Statistics — Theory and Methods, 38:19, P. 3501 [1]
  7. 7,0 7,1 Шаблон:Cite journal
  8. 8,0 8,1 Шаблон:Статья
  9. 9,0 9,1 Шаблон:Статья
  10. Шаблон:Статья
  11. Шаблон:Cite web
  12. Шаблон:Cite journal