Розклад невід'ємних матриць

Шаблон:Машинне навчання Розклад невід'ємних матриць^[1] (NMF(Non-negative matrix factorization)) це група алгоритмів багатовимірного аналізу та лінійної алгебри, де матриця V розкладається в, зазвичай, дві матриці W, H, враховуючи, що жодна з трьох матриць немає від'ємних елементів. Завдяки невід'ємності результуючі матриці легко перевіряються. Крім того, в таких програмах, як обробка аудіо спектрограм даним притаманна ця невід'ємність. Так як проблема немає точних розв'язків, в загальному випадку, зазвичай, знаходять числове наближення.

NMF застосовується в таких областях, як машинне бачення, кластеризація документів, хемометрика, обробка аудіо сигналів і рекомендаційні системи.

Історія

У хемометриці розклад невід'ємних матриць має довгу історію під назвою «крива самостійного моделювання»^[2].У рамках цього фреймворку вектори у правій матриці представляють неперервні криві, а не дискретні вектори. Також ранню роботу з розкладу невід'ємних матриць проводила група фінських вчених в середині 1990-х, під назвою «позитивної матричної факторизації».^[3]^[4] Він став широко відомим як факторизація невід'ємних матриць після того, як Лі і Сунг дослідили властивості алгоритму і опублікували кілька простих і корисних алгоритмів для двох типів факторизацій(множників).^[5]^[6]

Теорія

Нехай матриця V є добутком матриці W і H

𝐕 = 𝐖 𝐇 .

Множення матриць може бути реалізоване як обчислення вектор-стовпчиків матриці V,у вигляді лінійної комбінації вектор-стовпчиків матриці W використовуючи коефіцієнти, що відповідають векторам-рядкам матриці H.Тобто, кожен стовпець V може бути обчислено таким чином:

𝐯_{i} = 𝐖 𝐡_{i},

де v_i — і-ий вектор-стовпчик матриці V, a h_i — і-ий вектор-стовпчик матриці H.

При множенні матриць, розміри матриць-множників можуть бути значно меншими від розмірів матриці-результата і саме ця властивість формує основну властивість NMF-алгоритму. Тобто, NMF генерує матриці-множники, які набагато менші в порівнянні з вихідною матрицею. Наприклад, коли V розміру m×n, W — m×p, a H — p×n, то p може бути значно меншим від n i m.

Приклад на основі текстового аналізу: •Нехай матриця V має 10000 рядків і 500 стовпчиків, де слова є в рядках, а документи- стовпчиками. Тобто є 500 проіндексованих документів по 100000 слів. •Припустимо, нам потрібно знайти алгоритм, що дає 10 можливостей для того, щоб генерувати матриці W з 10000 рядків і 10 стовпців і коефіцієнти матриці H з 10 рядків і 500 стовпців. •Добуток W на H має розмірність 10000 на 500 і, якщо розклад спрацював правильно, елементи якого приблизно рівні елементам вихідної матриці V. •З цього випливає, що кожен стовпчик з матриці WH є лінійною комбінацією векторів 10 стовпців W і відповідних рядків з матриці H.

Цей останній пункт є основою NMF, тому що ми можемо розглядати кожен вихідний документ у нашому прикладі, який будується з невеликого набору прихованих функцій. NMF генерує ці функції.

Інколи корисно розглядати вектор стовпчик з властивостей матриці W як архетип документа, що містить набір слів, де значення комірки кожного слова визначає ранг даного слова у функції: чим вище значення слова, тим вище ранг слова в функції. Стовпчик в коефіцієнтах матриці H представляє оригінальний документ зі значенням, що визначає значення документа у функції. Це виконується, бо кожен рядок матриці H представляє функцію(властивість). Тепер ми можемо відновити документ (стовпчик вектор) з заданої матриці лінійною комбінацією властивостей (вектори- стовпчики в W ,де кожне значення рівне значенню клітинки із стовпчика документу у H.

Типи

Наближений розклад невід'ємних матриць

Зазвичай кількість стовпців у Wі к-сть рядків у H у NMF вибирається так, щоб WH було наближенням до V. Повний розклад V є двома невід'ємними матрицями W і H а також залишкової U, тобто : V = WH + U.Елементи залишкової матриці можуть бути як від'ємними, так і додатними.

Якщо W іHє меншими, ніж V , то їх легше зберігати і ними маніпулювати. Ще одна причина розкладу V на менші матриці W іH, якщо можна представити елементи V набагато меншою кількістю даних, то можна уявити структури, заховані у цих даних з набагато меншими втратами.

Опуклий розклад невід'ємних матриць

В стандартному NMF, фактор матриця $W \in ℜ_{+}^{m \times k}$ ， i.e., W може бути чим завгодно з цього простору. Опуклий NMF^[7] обмежує $W$ до опуклої комбінації векторів вхідних даних $(v_{1}, \dots, v_{n})$ .Це значно підвищує якість представлених даних W. Крім того, результат фактор матриці H стає більш розрідженим і ортогональним.

Невід'ємний ранг розкладу

Якщо невід'ємний ранг V рівний рангу, V=WH, то він називається невід'ємним рангом розкладу .^[8]^[9]^[10] Проблемою у відшуканні NRF для V,є те що така проблема є NP-повною.^[11]

Різновиди функцій втрат і регуляризації

Є різні типи розкладу невід'ємних матриць. Різні типи виникають із використанням різних функцій втрат для вимірювання різниці між V іWH і, можливо, із регуляризацією матриці W і/абоH .^[12]

Дві прості функції вивчені Лі і Сунгом — це квадрат помилки (або Фробеніусова норма) і розширення відмінності додатних матриць Кулбека-Лейблера. Кожна відмінність призводить до іншого алгоритму NMF, зазвичай мінімузуючого відмінність за допомогою ітеративного процесу.

Проблема факторизації у випадку NMF з квадратом помилки може записуватись так: Дано матрицю $𝐕$ знайти невід'ємні матриці W і H, що мінімізують функцію

F (𝐖, 𝐇) = ‖ 𝐕 - 𝐖 𝐇 ‖_{F}^{2}

Ще один тип NMF для зображень базується на нормі повної варіації.^[13]

Online NMF

Багато стандартних алгоритмів NMF аналізують всі дані разом, тобто вся матриця доступна з самого початку. Це може бути незадовільним в додатках, де є занадто багато даних, щоб поміститися в пам'яті або де дані представлені в потоковому вигляді. Прикладом таких може бути колаборативна фільтрація у рекомендаційній системі, де може бути багато користувачів і багато предметів, для рекомендацій, і це було б неефективно перерахувати все, коли один користувач або один елемент буде додано в систему. Функція втрат для оптимізації в таких випадках може або не може бути такою ж, як і для стандартного NMF, але алгоритми повинні бути досить різні.^[14]^[15]

Алгоритми

Є кілька способів знаходження W and H :правило мультиплікативного оновлення Лі і Сунга,^[6] було популярним методом з простою реалізацією. З того часу було розроблено ще кілька інших алгоритмів.

Кілька вдалих алгоритмів базуються на невід'ємних найменших квадратах non-negative least squares: на кожному кроці цього алгоритму, спочатку H є фіксованою, а W знаходиться методом невід'ємних найменших квадратів, тодіW стає фіксованою, а H знаходиться аналогічно. Процедура знаходження W і H може бути такою ж^[16] або відмінною, від варіанту регуляризації у NMF одної з W іH.^[17] Конкретні підходи включають Метод найшвидшого спуску,^[16]^[18] метод активної множини,^[19]^[20] а також метод повороту головного блоку.^[21]

Алгоритми, що доступні зараз є не зовсім оптимальними, бо вони можуть тільки гарантувати знаходження локального мінімуму, порівняно з глобольним мінімумом у функції втрат. Швидше за все оптимальний алгоритм навряд чи буде знайдено в найближчому майбутньому, так як проблема узагальнює проблему K-засобів кластеризації, яка, як відомо єNP-повною.^[22] Проте, в багатьох додатках з добування даних, локальний мінімум є корисним.

Точний NMF

Точний розв'язок для варіантів NMF можна очікувати (за поліноміальний час) коли на матрицю V накладаються додаткові обмеження. Поліноміальний алгоритм для знаходження невід'ємного рангу факторизації, якщо V містить одночлен субматрицю рангу, рівного за рангом даній(Кемпбелл і Пул в 1981 році).^[23] Kalofolias and Gallopoulos (2012)^[24] вирішити симетричний аналог цієї проблеми, де V симетрична і містить діагональ основної субматриці рангу г. Їх алгоритм виконується зі складністю O(rm²) при високій щільності. Arora, Ge, Halpern, Mimno, Moitra, Sontag, Wu, & Zhu (2013) продемонстрували точний поліноміальний алгоритм NMF, який працює у випадку, де один з факторів W задовольняє умову роздільності.^[25]

Посилання

Шаблон:Reflist

Додатково

Шаблон:Refbegin

Шаблон:Refend

↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ ^6,0 ^6,1 Шаблон:Cite conference Шаблон:Недоступне посилання
↑ C Ding, T Li, MI Jordan, Convex and semi-nonnegative matrix factorizations, IEEE Transactions on Pattern Analysis and Machine Intelligence, 32, 45-55, 2010
↑ Шаблон:Cite journal
↑ Шаблон:Cite book
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite conference
↑ Шаблон:Cite doi
↑ Шаблон:Cite web
↑ http://portal.acm.org/citation.cfm?id=1339264.1339709
↑ ^16,0 ^16,1 Шаблон:Cite doi
↑ Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою hoyer02 не вказано текст
↑ Шаблон:Cite doi
↑ Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою gemulla не вказано текст
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal Шаблон:Недоступне посилання
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite conference

[1] Шаблон:Cite journal

[2] Шаблон:Cite journal

[3] Шаблон:Cite journal

[4] Шаблон:Cite journal

[lee-seung-5] Шаблон:Cite journal

[lee2001algorithms-6] 6,0 ^6,1 Шаблон:Cite conference Шаблон:Недоступне посилання

[ding-7] C Ding, T Li, MI Jordan, Convex and semi-nonnegative matrix factorizations, IEEE Transactions on Pattern Analysis and Machine Intelligence, 32, 45-55, 2010

[BermanPlemmons74-8] Шаблон:Cite journal

[BermanPlemmons94-9] Шаблон:Cite book

[Thomas74-10] Шаблон:Cite journal

[Vavasis09-11] Шаблон:Cite journal

[dhillon-12] Шаблон:Cite conference

[13] Шаблон:Cite doi

[14] Шаблон:Cite web

[15] ttp://portal.acm.org/citation.cfm?id=1339264.1339709

[lin07-16] 16,0 ^16,1 Шаблон:Cite doi

[hoyer02-17] Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою hoyer02 не вказано текст

[18] Шаблон:Cite doi

[gemulla-19] Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою gemulla не вказано текст

[kim2008nonnegative-20] Шаблон:Cite journal

[kim2011fast-21] Шаблон:Cite journal Шаблон:Недоступне посилання

[22] Шаблон:Cite journal

[CampbellPoole81-23] Шаблон:Cite journal

[KalofoliasGallopoulos2012-24] Шаблон:Cite journal

[Arora2013-25] Шаблон:Cite conference

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

Розклад невід'ємних матриць

Зміст

Історія

Теорія

Типи

Наближений розклад невід'ємних матриць

Опуклий розклад невід'ємних матриць

Невід'ємний ранг розкладу

Різновиди функцій втрат і регуляризації

Online NMF

Алгоритми

Точний NMF

Посилання

Додатково

Навігаційне меню

Розклад невід'ємних матриць

Історія

Теорія

Типи

Наближений розклад невід'ємних матриць

Опуклий розклад невід'ємних матриць

Невід'ємний ранг розкладу

Різновиди функцій втрат і регуляризації

Online NMF

Алгоритми

Точний NMF

Посилання

Додатково

Навігаційне меню

Пошук