Типи штучних нейронних мереж

Шаблон:Short description Існує багато типів штучних нейронних мереж (ШНМ, Шаблон:Lang-en).

Штучні нейронні мережі — це Шаблон:Нп, натхнені біологічними нейронними мережами, й які використовують, щоби наближувати функції, зазвичай невідомі. Зокрема, їх надихає поведінка нейронів та електричних сигналів, які вони передають між входом (наприклад, від очей або нервових закінчень у руці), обробкою, та виходом із мозку (наприклад, реакцією на світло, дотик або тепло). Спосіб забезпечення нейронами семантичного зв'язку є областю поточних досліджень.^[1]^[2]^[3]^[4] Більшість штучних нейронних мереж лише дещо схожі на свої складніші біологічні аналоги, але вони дуже ефективні у виконанні поставлених завдань (наприклад, класифікування чи сегментування).

Деякі штучні нейронні мережі є адаптивними системами, і їх використовують, наприклад, для Шаблон:Нп та середовищ, які постійно змінюються.

Нейронні мережі можуть бути апаратними (нейрони подано фізичними складовими) та Шаблон:Нп (комп'ютерні моделі), й можуть використовувати різноманітні топології та алгоритми навчання.

Шаблон:TOC limit

Прямого поширення

Шаблон:Main

Нейронна мережа прямого поширення (Шаблон:Lang-en) була першим і найпростішим типом. У цій мережі інформація рухається лише від шару входу безпосередньо крізь будь-які приховані шари до шару виходу, без циклів/петель. Мережі прямого поширення можливо будувати за допомогою різних типів вузлів, таких як бінарні нейрони Маккаллоха — Піттса, найпростішим з яких є перцептрон. Неперервні нейрони, часто з сигмоїдною передавальною функцією, використовують у контексті зворотного поширення.

Метод групового урахування аргументів

Шаблон:Main

Метод групового урахування аргументів (МГУА, Шаблон:Lang-en)^[5] має повністю автоматичну структурну та параметричну оптимізацію моделі. Передавальними функціями вузлів є поліноми Колмогорова — Габора, які допускають додавання та множення. Він використовує глибокий багатошаровий перцептрон із вісьмома шарами.^[6] Це мережа керованого навчання, яка зростає шар за шаром, де кожен шар тренується за допомогою регресійного аналізу. Непотрібні елементи виявляються за допомогою затверджувального набору й відсікаються за допомогою регуляризації. Розмір та глибина отримуваної мережі залежать від поставленого завдання.^[7]

Автокодувальник

Шаблон:Main

Автокодувальник (Шаблон:Lang-en), автоасоціатор, або мережа діаболо^[8]Шаблон:Rp схожий на багатошаровий перцептрон (БШП, Шаблон:Lang-en) — із шаром входу, шаром виходу й одним або декількома прихованими шарами, що їх з'єднують. Проте шар виходу має таку ж кількість вузлів, що й шар входу. Його призначення — відбудовувати власні дані входу (замість видавати цільове значення). Тож автокодувальники — моделі некерованого навчання. Автокодувальник використовують для некерованого навчання ефективних кодувань,^[9]^[10] зазвичай з метою зниження розмірності та для навчання породжувальних моделей даних.^[11]^[12]

Імовірнісний

Шаблон:Main

Імовірнісна нейронна мережа (ІНМ, Шаблон:Lang-en) — це чотирирівнева нейронна мережа прямого поширення. Шари: входу, приховані образів та підсумовування, та виходу. В алгоритмі ІНМ батьківську функцію густини ймовірності (ФГІ, Шаблон:Lang-en) кожного класу наближують вікном Парцена та непараметричною функцією. Потім, використовуючи ФГІ кожного класу, оцінюють класову ймовірність нового входу й використовують правило Баєса, щоби віднести його до класу з найвищою апостеріорною ймовірністю.^[13] Її отримали з баєсової мережі^[14] та статистичного алгоритму під назвою Шаблон:Нп.^[15] Її використовують для класифікування та розпізнавання образів.

Часова затримка

Шаблон:Main

Нейронна мережа з часовою затримкою (Шаблон:Lang-en) — це архітектура прямого поширення для послідовних даних, яка розпізнає ознаки незалежно від положення в послідовності. Щоби досягти інваріантності щодо зсуву в часі, до даних входу додають затримки, щоби кілька точок даних (точок у часі) аналізувалися разом.

Зазвичай вона є частиною більшої системи розпізнавання образів. Її втілювали за допомогою мережі перцептрона, вагові коефіцієнти з'єднань якої було треновано зворотним поширенням (керованим навчанням).^[16]

Згорткова

Шаблон:Main

Згорткова нейронна мережа (ЗНМ, Шаблон:Lang-en, або зсувоінваріанта чи просторовоінваріантна, Шаблон:Lang-en) — це клас глибоких мереж, складених з одного або кількох згорткових шарів, із повноз'єднаними шарами (що відповідають шарам типових ШНМ) нагорі.^[17]^[18] Вона використовує зв'язані ваги та шари агрегування. Зокрема, максимізаційного агрегування (Шаблон:Lang-en).^[19] Її часто структурують за допомогою згорткової архітектури Фукусіми.^[20] Вони є видозмінами багатошарових перцептронів, які використовують мінімальну попередню обробку.^[21] Ця архітектура дозволяє ЗНМ використовувати переваги двовимірної структури даних входу.

Її схема з'єднання вузлів натхнена будовою зорової кори. Вузли реагують на стимули в обмеженій області простору, відомій як рецептивне поле. Рецептивні поля частково перекриваються, накриваючи все поле зору. Відгук вузла можливо наблизити математично операцією згортки.^[22]

ЗНМ підходять для обробки візуальних та інших двовимірних даних.^[23]^[24] Вони показали чудові результати у застосуваннях як до зображень, так і до мовлення. Їх можливо тренувати стандартним зворотним поширенням. ЗНМ тренувати легше, ніж інші звичайні глибокі нейронні мережі прямого поширення, і вони мають набагато менше параметрів для оцінювання.^[25]

Капсульні нейронні мережі (Шаблон:Lang-en) додають до ЗНМ структури, звані капсулами (Шаблон:Lang-en), й перевикористовують дані виходу кількох капсул для формування стабільніших (щодо різних збурень) подань.^[26]

До прикладів застосувань у комп'ютерному зорі належать DeepDream^[27] і Шаблон:Нп.^[28] Вони мають широке застосування в розпізнаванні зображень і відео, рекомендаційних системах^[29] та обробці природної мови.^[30]

Глибока складальна мережа

Глибока складальна мережа (ГСМ, Шаблон:Lang-en)^[31] (глибока опукла мережа, Шаблон:Lang-en) ґрунтується на ієрархії блоків спрощених нейромережних модулів. Її запропонували 2011 року Ден та Ю.^[32] Вона формулює навчання як задачу опуклої оптимізації з розв'язком замкненого вигляду, підкреслюючи подібність цього механізму до складального узагальнювання.^[33] Кожен блок ГСМ — це простий модуль, який сам по собі легко натренувати керованим чином без зворотного поширення для цілих блоків.^[8]

Кожен блок складається зі спрощеного багатошарового перцептрона (БШП) з єдиним прихованим шаром. Прихований шар h має логістичні сигмоїдні вузли, а шар виходу — лінійні. З'єднання між цими шарами подано ваговою матрицею U; з'єднання входу з прихованим шаром мають вагову матрицю W. Цільові вектори t утворюють стовпці матриці T, а вектори даних входу x утворюють стовпці матриці X. Матрицею прихованих вузлів є $𝑯 = σ (𝑾^{T} 𝑿)$ . Модулі тренують по черзі, тож ваги нижчого шару W на кожному етапі відомі. Функція виконує поелементну логістичну сигмоїдну дію. Кожен із блоків оцінює один і той же клас кінцевих міток y, і його оцінка поєднується з первинним входом X для утворення розширеного входу для наступного блоку. Таким чином, вхід першого блоку містить лише первинні дані, тоді як до входів наступних блоків додаються також і виходи попередніх блоків. Тоді навчання вагової матриці U вищого шару за заданих інших ваг у мережі можливо сформулювати як задачу опуклої оптимізації:

\min_{U^{T}} f = ‖ 𝑼^{T} 𝑯 - 𝑻 ‖_{F}^{2},

що має розв'язок замкненого вигляду.^[31]

На відміну від інших глибоких архітектур, таких як ГМП, метою є не виявляння перетвореного подання ознак. Структура ієрархії такого типу архітектури робить паралельне навчання прямолінійним, як задача оптимізації в пакетному режимі. У суто розрізнювальних завданнях ГСМ перевершують звичайні ГМП.

Тензорні глибокі складальні мережі

Ця архітектура — розширення ГСМ. Вона пропонує два важливі вдосконалення: вона використовує інформацію вищого порядку з коваріаційних статистик, і вона перетворює неопуклу задачу нижчого шару на опуклу підзадачу вищого шару.^[34] ТГСМ використовують коваріаційну статистику в білінійному відображенні з кожного з двох окремих наборів прихованих вузлів одного й того ж шару до передбачень за допомогою тензора третього порядку.

В той час як розпаралелювання й масштабованість у звичайних Шаблон:H:title не розглядають серйозно,^[35]^[36]^[37] все навчання для Шаблон:H:title і Шаблон:H:title здійснюється в пакетному режимі, що уможливлює розпаралелювання.^[32]^[31] Розпаралелювання дозволяє масштабувати цю конструкцію на більші (глибші) архітектури та набори даних.

Ця базова архітектура підходить для різноманітних завдань, таких як класифікування та регресія.

Регуляторний зворотній зв'язок

Мережі з регуляторним зворотним зв'язком (Шаблон:Lang-en) мали початок як модель для пояснення мозкових явищ, виявляних під час розпізнавання, включно Шаблон:Нп в усій мережі та Шаблон:Нп, універсальними при сенсорному розпізнаванні. Механізм для виконання оптимізації під час розпізнавання створюють за допомогою гальмівних з'єднань зворотного зв'язку з тими же входами, які їх активують. Це зменшує вимоги під час навчання та дозволяє полегшити навчання та уточнення, залишаючи можливість виконувати складне розпізнавання.

Мережа з регуляторним зворотним зв'язком здійснює висновування з використанням негативного зворотного зв'язку.^[38] Зворотній зв'язок використовується для пошуку оптимального збудження вузлів. Це найбільше схоже на Шаблон:Нп, але відрізняється від k-найближчих сусідів тим, що математично емулює мережі прямого поширення.

Радіальні базисні функції (РБФ)

Шаблон:Main

Радіальні базисні функції (Шаблон:Lang-en) — це функції, які мають критерій відстані відносно якогось центру. Радіальні базисні функції застосовували як заміну сигмоїдної передавальної характеристики прихованого шару в багатошарових перцептронах. Радіальнобазисні мережі (РБМ) мають два шари: на першому дані входу відображувано на кожну РБФ у «прихованому» шарі. Як РБФ зазвичай обирають гауссіани. У задачах регресії шар виходу це лінійна комбінація значень прихованого шару, що подає середній передбачуваний результат. Інтерпретація цього значення шару виходу така же, як і регресійна модель у статистиці. У задачах класифікування шар виходу це зазвичай сигмоїдна функція лінійної комбінації значень прихованого шару, що подає апостеріорну ймовірність. Продуктивність в обох випадках часто покращують за допомогою Шаблон:Нп методик, відомих у класичній статистиці як гребенева регресія. Це відповідає апріорному переконанню в малих значеннях параметрів (а відтак і гладких функціях виходу) в баєсовій системі.

Радіальнобазисні мережі мають перевагу уникання локальних мінімумів так само, як і багатошарові перцептрони. Це пов'язано з тим, що єдині параметри, які підлаштовуються в процесі навчання, це лінійне відображення з прихованого шару до шару виходу. Лінійність гарантує, що поверхня похибки квадратична, і відтак має єдиний мінімум, який легко знаходити. У задачах регресії його можливо знаходити за одну матричну операцію. У задачах класифікування із фіксованою нелінійністю, яку вносить сигмоїдна функція виходу, найефективніше впоруватися за допомогою Шаблон:Нп.

РБМ мають недолік вимагання доброго покриття простору входу радіальними базисними функціями. Центри РБФ визначають із прив'язкою до розподілу даних входу, але без прив'язки до завдання передбачування. Як результат, ресурси подання можуть марнуватися на ділянках простору входу, що не мають відношення до цього завдання. Поширене розв'язання — пов'язати кожну точку даних з її власним центром, хоча це може розширювати лінійну систему для розв'язування на кінцевому шарі, й потребувати стискальних методик задля уникнення перенавчання.

Пов'язування кожних вхідних даних із РБФ природним чином призводить до таких ядрових методів як опорновекторні машини (ОВМ) та гауссові процеси (РБФ — Шаблон:Нп). Усі три підходи використовують нелінійну ядрову функцію для проєціювання даних входу до простору, в якому задачу навчання можливо розв'язати за допомогою лінійної моделі. Подібно до гауссових процесів, і на відміну від ОВМ, радіальнобазисні мережі зазвичай тренують за системою максимальної правдоподібності, максимізуючи ймовірність (мінімізуючи похибку). ОВМ уникають перенавчання, максимізуючи натомість розділення. ОВМ перевершують РБМ у більшості застосувань класифікування. У застосуваннях регресії вони можуть бути конкурентоспроможними, коли розмірність простору входу відносно мала.

Як працюють РБМ

Радіальнобазисні нейронні мережі концептуально подібні моделям k-найближчих сусідів (k-НС). Основна ідея полягає в подібності виходів для подібних входів.

Припустімо, що кожен випадок у тренувальному наборі має дві змінні—передбачувачі, x та y, а цільова змінна має дві категорії, позитивну та негативну. Як обчислюється цільова змінна за заданого нового випадку з передбачувальними значеннями x = 6, y = 5,1?

Класифікація найближчих сусідів, виконувана для цього прикладу, залежить від того, скільки сусідніх точок розглядають. Якщо використовують 1-НС, і найближча точка негативна, то нову точку слід класифікувати як негативну. Іншим чином, якщо використовують класифікацію 9-НС і враховують найближчі 9 точок, то вплив навколишніх 8 позитивних точок може переважити найближчу 9-ту (негативну) точку.

РБМ розташовує нейрони в просторі, описуваному змінними—передбачувачами (x, y у цьому прикладі). Цей простір має стільки вимірів, скільки змінних—передбачувачів. Евклідову відстань обчислюють від нової точки до центру кожного нейрона, а радіальну базисну функцію (РБФ, також звану ядровою функцією) застосовують до відстані для обчислення ваги (впливу) для кожного нейрона. Радіальну базисну функцію називають так тому, що аргументом цією функції є радіусна відстань.

Вага = РБФ (відстань)

Радіальна базисна функція

Значення для нової точки визначають підсумовуванням значень виходу функцій РБФ, помножених на ваги, обчислені для кожного нейрона.

Радіальна базисна функція для нейрона має центр і радіус (також званий розкидом, Шаблон:Lang-en). Радіус може бути різним для кожного нейрона, а в РБМ, породжуваних DTREG, радіус може відрізнятися й у кожному вимірі.

За більшого розкиду віддалені від точки нейрони мають більший вплив.

Архітектура

РБМ мають три шари:

Шар входу: у шарі входу по одному нейрону для кожної змінної—передбачувача. У випадку категорійних змінних використовують N-1 нейронів, де N — кількість категорій. Нейрони входу стандартизують діапазони значень відніманням медіани та діленням на міжквартильний розмах. Потім нейрони входу передають значення кожному з нейронів прихованого шару.
Прихований шар: цей шар має змінну кількість нейронів (визначувану процесом тренування). Кожен нейрон складається з радіальної базисної функції з центром у точці з такою кількістю вимірів, скільки змінних—передбачувачів. Розкид (радіус) РБФ може відрізнятися для кожного виміру. Центри та розкиди визначає тренування. Коли подано вектор x значень входу з шару входу, прихований нейрон обчислює евклідову відстань цього випробувального випадку від своєї центральної точки, а потім застосовує ядрову РБФ до цієї відстані, використовуючи значення розкиду. Отримане значення передається на рівень підсумовування.
Рівень підсумовування: значення, що надходить із нейрона в прихованому шарі, множиться на вагу, пов'язану з цим нейроном, і додається до зважених значень інших нейронів. Ця сума стає результатом. Для задач класифікування видається по одному виходу (з окремим набором вагових коефіцієнтів та одиницею підсумовування) для кожної цільової категорії. Вихідним значенням для категорії є ймовірність того, що оцінюваний випадок має цю категорію.

Тренування

Процес тренування визначає такі параметри:

Кількість нейронів у прихованому шарі
Координати центру кожної РБФ прихованого шару
Радіус (розкид) кожної РБФ у кожному вимірі
Ваги, застосовувані до виходів РБФ, коли вони переходять на рівень підсумовування

Для тренування РБМ використовували різні методи. Один підхід спочатку використовує кластерування методом k-середніх для пошуку центрів кластерів, які потім використовують як центри для РБФ. Проте кластерування методом k-середніх обчислювально витратне й часто не породжує оптимальної кількості центрів. Інший підхід полягає у використанні випадкової підмножини тренувальних точок як центрів.

DTREG використовує алгоритм тренування, який використовує еволюційний підхід для визначання оптимальних точок центрів та розкидів для кожного нейрона. Він визначає, коли припинити додавання нейронів до мережі, відстежуючи оцінювану похибку виключення по одному (Шаблон:Lang-en), і припиняючи, коли похибка LOO починає збільшуватися через перенавчання.

Обчислення оптимальних ваг між нейронами в прихованому шарі та шарі підсумовування виконують за допомогою гребеневої регресії. Ітеративна процедура обчислює оптимальний параметр лямбда регуляризації, який мінімізує похибку узагальненого перехресного затверджування (Шаблон:Lang-en).

Узагальнена регресійна нейронна мережа

Шаблон:Main

Узагальнена регресійна нейронна мережа (Шаблон:Lang-en) — це нейронна мережа асоціативної пам'яті, подібна до ймовірнісної нейронної мережі, але яку використовують для регресії та наближення, а не для класифікування.

Глибока мережа переконань

Обмежена машина Больцмана (ОМБ, Шаблон:Lang-en) із повноз'єднаними видимими та прихованими вузлами. Зауважте, що з'єднань прихований—прихований та видимий—видимий немає.

Шаблон:Main

Глибока мережа переконань (ГМП, Шаблон:Lang-en) — це ймовірнісна породжувальна модель, що складається з кількох прихованих шарів. Її можливо вважати композицією простих модулів, що вчаться.^[39]

ГМП можливо використовувати для породжувального попереднього тренування глибокої нейронної мережі (ГНМ, Шаблон:Lang-en), використовуючи отримані ваги ГМП як початкові ваги ГНМ. Потім різні розрізнювальні алгоритми можуть доналаштовувати ці ваги. Це особливо корисно, коли тренувальні дані обмежені, оскільки погано встановлені початкові ваги можуть значно перешкоджати тренуванню. Ці попередньо натреновані ваги потрапляють в область простору ваг, ближчу до оптимальних ваг, ніж випадкові варіанти. Це забезпечує як покращене моделювання, так і швидшу остаточну збіжність.^[40]

Рекурентна нейронна мережа

Шаблон:Main

Рекурентні нейронні мережі (РНМ, Шаблон:Lang-en) поширюють дані вперед, але також і назад, від пізніших етапів обробки до попередніх. РНМ можливо використовувати як загальні обробники послідовностей.

Повнорекурентна

Цю архітектуру розроблено в 1980-х роках. Її мережа створює орієнтоване з'єднання між кожною парою вузлів. Кожен має змінне в часі дійснозначне (більше ніж просто нуль або одиниця) збудження (вихід). Кожне з'єднання має змінювану дійснозначну вагу. Деякі з вузлів називаються міченими вузлами, деякі — вузлами виходу, решту — прихованими вузлами.

Для керованого навчання в дискретночасовій постановці тренувальні послідовності дійснозначних векторів входу стають послідовностями збудження вузлів входу, по одному вектору входу за раз. На кожному кроці часу кожен невхідний вузол обчислює своє поточне збудження як нелінійну функцію зваженої суми збуджень усіх вузлів, від яких він отримує з'єднання. Система може явно збуджувати (незалежно від сигналів входу) деякі вузли виходу в певні моменти часу. Наприклад, якщо послідовність входу ще мовленнєвий сигнал, що відповідає вимовленій цифрі, кінцевим цільовим виходом у кінці послідовності може бути мітка, яка класифікує цю цифру. Для кожної послідовності її похибка це сума відхилень усіх збуджень, обчислених мережею, від відповідних цільових сигналів. Для тренувального набору численних послідовностей загальна похибка це сума помилок усіх окремих послідовностей.

Щоби мінімізувати загальну похибку, можливо використовувати градієнтний спуск, щоби змінювати кожну вагу пропорційно її похідній відносно похибки, за умови, що нелінійні передавальні функції диференційовні. Стандартний метод називають «зворотним поширенням у часі» або ЗПЧ (Шаблон:Lang-en), це узагальнення зворотного поширення для мереж прямого поширення.^[41]^[42] Обчислювально витратніший інтерактивний варіант називають «реальночасовим рекурентним навчанням» або РЧРН (Шаблон:Lang-en).^[43]^[44] На відміну від ЗПЧ цей алгоритм локальний у часі, але не локальний у просторі.^[45]^[46] Існує інтерактивний гібрид ЗПЧ та ЗЧРН із проміжною складністю^[47]^[48] з варіантами для безперервного часу.^[49] Основна проблема з градієнтним спуском для стандартних архітектур РНМ полягає в тому, що градієнти похибок зникають експоненційно швидко з розміром часової затримки між важливими подіями.^[50]^[51] Ці проблеми долає архітектура довгої короткочасної пам'яті.^[52]

У постановці навчання з підкріпленням жоден учитель не надає цільових сигналів. Натомість для оцінювання продуктивності час від часу використовується функція допасованості, або функція винагороди, або функція корисності, яка впливає на потік входу через вузли виходу, з'єднані з приводами, які впливають на середовище. Для оптимізації вагової матриці часто використовують варіанти еволюційного обчислення.

Гопфілда

Шаблон:Main

Мережа Гопфілда (як і подібні мережі на основі атракторів) становить історичний інтерес, хоча вона не є загальною РНМ, оскільки вона не призначена для обробки послідовностей зразків. Натомість їй потрібні стаціонарні входи. Це РНМ, у якій усі з'єднання симетричні. Вона гарантує свою збіжність. Якщо з'єднання треновано з використанням геббового навчання, мережа Гопфілда може працювати як робастна асоціативна пам'ять, стійка до змін з'єднань.

Машина Больцмана

Шаблон:Main

Машину Больцмана можливо розглядати як зашумлену мережу Гопфілда. Це одна з перших нейронних мереж, яка продемонструвала навчання латентних змінних (прихованих вузлів). Навчання машини Больцмана спочатку симулювалося повільно, але алгоритм контрастивного розходження пришвидшує тренування машин Больцмана та Шаблон:Нп.

Самоорганізаційна карта

Шаблон:Main

Самоорганізаційна карта (СОК, Шаблон:Lang-en) використовує некероване навчання. Набір нейронів навчається відображувати точки простору входу на координати у просторі виходу. Простір входу може мати відмінні виміри та топологію, ніж простір виходу, і СОК намагається їх зберегти.

Навчане векторне квантування

Шаблон:Main

Шаблон:Нп (НВК, Шаблон:Lang-en) можливо інтерпретувати як нейромережну архітектуру. Прототипні представники класів параметризують, разом із відповідною мірою відстані, у схемі класифікації на основі відстані.

Проста рекурентна

Прості рекурентні мережі (Шаблон:Lang-en) мають три шари з додаванням набору «контекстних вузлів» на шарі входу. До цих вузлів надходять з'єднання з прихованого шару або шару виходу з фіксованою одиничною вагою.^[53] На кожному часовому кроці вхідні дані поширюються стандартним прямим чином, а потім застосовується подібне до зворотного поширення правило навчання (без виконання градієнтного спуску). Фіксовані зворотні з'єднання залишають копію попередніх значень прихованих вузлів у контекстних вузлах (оскільки вони поширюються з'єднаннями до застосування правила навчання).

Резервуарне обчислення

Шаблон:Main

Резервуарне обчислення (Шаблон:Lang-en) — це обчислювальна система, яку можливо розглядати як розширення нейронних мереж.^[54] Зазвичай сигнал входу подають у фіксовану (випадкову) динамічну систему, звану резервуаром (Шаблон:Lang-en), чия динаміка відображає сигнал входу до вищої вимірності. Механізм зчитування (Шаблон:Lang-en) тренують відображувати цей резервуар до бажаного виходу. Тренування здійснюють лише на етапі зчитування. Одним із типів резервуарного обчислення є рідкі скінченні автомати.^[55]^[56]

Відлуння стану

Шаблон:Main

Мережа з відлунням стану (МВС, Шаблон:Lang-en) використовує розріджено з'єднаний випадковий прихований шар. Єдиною тренованою частиною мережі є ваги нейронів виходу. МВС добре відтворюють певні часові ряди.^[57]

Довга короткочасна пам'ять

Шаблон:Main

Довга короткочасна пам'ять (ДКЧП, Шаблон:Lang-en)^[52] дозволяє уникати проблеми зникання градієнта. Вона працює навіть із великими затримками між входами та може обробляти сигнали, які змішують низькочастотні та високочастотні складові. РНМ ДКЧП перевершували інші РНМ та інші методи навчання послідовностей, такі як ПММ, у таких застосуваннях як вивчення мови^[58] та розпізнавання неперервного рукописного тексту.^[59]

Двонапрямна

Шаблон:Main

Двонапрямна РНМ, або ДРНМ (Шаблон:Lang-en), використовує скінченну послідовність для передбачування або мічення кожного елемента послідовності на основі як минулого, так і майбутнього контексту цього елемента.^[60] Це здійснюють додаванням виходів двох РНМ: одна оброблює послідовність зліва направо, інша — справа наліво. Поєднані виходи це передбачувачі надаваних учителем цільових сигналів. Ця методика виявилася особливо корисною у поєднанні з ДКЧП.^[61]

Ієрархічна

Шаблон:Main

Ієрархічна РНМ (Шаблон:Lang-en) поєднує елементи різними способами, щоби розкласти ієрархічну поведінку на корисні підпрограми.^[62]^[63]

Стохастична

Шаблон:Main

Відмінну форму звичайних нейронних мереж, стохастичну штучну нейронну мережу (Шаблон:Lang-en), використовували як наближення випадкових функцій.

Генетичний масштаб

РНМ (часто ДКЧП), де ряд розкладають на кілька масштабів, кожен з яких інформує про основну відстань між двома послідовними точками. Масштаб першого порядку складається з нормальної РНМ, другого порядку складається з усіх точок, розділених двома індексами, і так далі. РНМ N-го порядку з'єднує перший та останній вузол. Результати з усіх різних масштабів розглядають як Шаблон:Нп, а пов'язані оцінки використовують генетично для наступної ітерації.

Модульна

Шаблон:Main

Біологічні дослідження показали, що людський мозок працює як сукупність невеликих мереж. Це усвідомлення породило поняття модульних нейронних мереж, у яких кілька невеликих мереж співпрацюють або змагаються для розв'язання задачі.

Комітет машин

Шаблон:Main

Комітет машин (КМ, Шаблон:Lang-en) — це набір різних нейронних мереж, які разом «голосують» за певний приклад. Загалом це дає набагато кращий результат, ніж окремі мережі. Оскільки нейронні мережі страждають на локальні мінімуми, починання з тієї самої архітектури та тренування, але з використанням випадково різних початкових ваг, часто дають дуже різні результати.Шаблон:Citation needed КМ прагне стабілізувати цей результат.

КМ схожий на загальний метод машинного навчання натяжкове агрегування (Шаблон:Lang-en), за винятком того, що необхідну різноманітність машин у комітеті отримують тренуванням з різними початковими вагами, а не тренуванням на різних випадково вибраних підмножинах тренувальних даних.

Асоціативна

Асоціативна нейронна мережа (АСНМ, Шаблон:Lang-en) — це розширення комітету машин, яке поєднує декілька нейронних мереж прямого поширення та методику k-найближчих сусідів. Вона використовує кореляцію між відгуками ансамблю як міру відстані серед проаналізованих випадків для kНС. Це виправляє зміщення ансамблю нейронної мережі. Асоціативна нейронна мережа має пам'ять, яка може збігатися з тренувальним набором. Якщо стають доступними нові дані, мережа миттєво покращує свою передбачувальну здатність і забезпечує наближення даних (самонавчається) без перетреновування. Інша важлива особливість АСНМ це можливість інтерпретування результатів нейронної мережі шляхом аналізу кореляцій між випадками даних у просторі моделей.^[64]

Фізична

Шаблон:Main

Фізична нейронна мережа (Шаблон:Lang-en) містить електрично регульований опірний матеріал для імітування штучних синапсів. До прикладів належить нейронна мережа ADALINE на основі мемристорів.^[65] Оптична нейронна мережа це фізичне втілення штучної нейронної мережі на оптичних складових.

Динамічна

Динамічні нейронні мережі (Шаблон:Lang-en) розглядають нелінійну багатовимірну поведінку та включають (навчання) залежної від часу поведінки, такої як перехідні явища та ефекти затримки. Методики оцінювання системного процесу на основі спостережуваних даних підпадають під загальну категорію виявляння системи.

Каскадна

Каскадна кореляція (Шаблон:Lang-en) — це архітектура та алгоритм керованого навчання. Замість простого підлаштовування ваг у мережі з фіксованою топологією^[66] каскадна кореляція починається з мінімальної мережі, а потім автоматично тренується й додає нові приховані вузли один за одним, створюючи багатошарову структуру. Щойно новий прихований вузол додано до мережі, його ваги з боку входу заморожуються. Тоді цей вузол стає постійним виявлячем ознак у мережі, доступним для отримування виходів або для створення інших, складніших виявлячів ознак. Архітектура каскадної кореляції має кілька переваг: вона швидко навчається, визначає власний розмір і топологію, зберігає створені структури, навіть якщо тренувальний набір змінюється, і не вимагає зворотного поширення.

Нейронечітка

Шаблон:Main

Нейронечітка мережа (Шаблон:Lang-en) — це система нечіткого висновування (СНВ, Шаблон:Lang-en) в тілі штучної нейронної мережі. Залежно від типу СНВ кілька шарів імітують процеси, залучені у подібних до нечіткого висновування внесенні нечіткості (Шаблон:Lang-en), висновуванні, агрегуванні та відновленні чіткості (Шаблон:Lang-en). Вбудовування СНВ у загальну структуру ШНМ має перевагу використання доступних методів тренування ШНМ для знаходження параметрів нечіткої системи.

Композиційна шаблоностворювальна

Шаблон:Main

Композиційні шаблоностворювальні мережі (КШСМ, Шаблон:Lang-en) — це різновид штучних нейронних мереж, які відрізняються своїм набором передавальних функцій та способом їх застосовування. У той час як типові штучні нейронні мережі часто містять лише сигмоїдні функції (й іноді гауссові), КШСМ можуть містити обидва типи функцій та багато інших. Крім того, на відміну від типових штучних нейронних мереж, КШСМ застосовують над усім простором можливих даних входу, щоби вони могли подавати повне зображення. Оскільки вони є композиціями функцій, КШСМ фактично кодують зображення з нескінченною роздільністю, і їх можливо дискретизувати для конкретного дисплея з будь-якою оптимальною роздільністю.

Мережі з пам'яттю

Мережі з пам'яттю (Шаблон:Lang-en)^[67]^[68] включають Шаблон:Нп. Цю довготривалу пам'ять можливо читати та записувати до неї з метою використання її для передбачування. Ці моделі застосовували в контексті відповідання на питання (Шаблон:Lang-en), де довготривала пам'ять фактично діє як (динамічна) база знань, а виходом є текстова відповідь.^[69]

У Шаблон:Нп та ієрархічній часовій пам'яті образи, закодовані нейронними мережами, використовуються як адреси асоціативної пам'яті, причому «нейрони» по суті слугують кодувальниками та декодувальниками адрес. Проте ранні контролери таких видів пам'яті не були диференційовними.^[70]

Асоціативна пам'ять з одного погляду

Цей тип мережі (Шаблон:Lang-en) може додавати нові образи без перетреновування. Це здійснюється шляхом створення спеціальної структури пам'яті, яка призначує кожен новий образ ортогональній площині за допомогою суміжно з'єднаних ієрархічних масивів.^[71] Ця мережа пропонує реальночасове розпізнавання образів та високу масштабованість; це вимагає паралельної обробки й тому найкраще підходить для таких платформ, як бездротові сенсорні мережі, мережні обчислення та ГПЗП.

Ієрархічна часова пам'ять

Шаблон:Main

Ієрархічна часова пам'ять (ІЧП, Шаблон:Lang-en) моделює деякі структурні та алгоритмічні властивості нової кори. ІЧП — біоміметична модель, що ґрунтується на теорії пам'яті — передбачування. ІЧП — це метод для виявляння та висновування високорівневих причин спостережуваних вхідних образів та послідовностей, і відтак побудови дедалі складнішої моделі світу.

ІЧП поєднує наявні ідеї щоби імітувати нову кору простою конструкцією, яка пропонує багато можливостей. ІЧП поєднує та розширює підходи, використовувані в баєсових мережах, алгоритмах просторового та часового кластерування, використовуючи при цьому деревоподібну ієрархію вузлів, поширену в нейронних мережах.

Голографічна асоціативна пам'ять

Шаблон:Main

Голографічна асоціативна пам'ять (ГАП, Шаблон:Lang-en) — це аналогова кореляційна асоціативна система «стимул-відгук». Інформація відображається на фазове спрямування комплексних чисел. Ця пам'ять ефективна для завдань асоціативного запам'ятовування, узагальнювання та розпізнавання образів зі змінною увагою. Динамічна локалізація пошуку є центральною для біологічної пам'яті. При зоровому сприйнятті люди зосереджуються на конкретних об'єктах в образі. Люди можуть змінювати зосередження з об'єкта на об'єкт без навчання. ГАП може імітувати цю здатність, створюючи явні подання для зосереджування. Вона використовує бімодальне подання образа та схожий на голограму комплексний сферичний ваговий простір станів. ГАМ корисні для оптичного втілювання, оскільки гіперсферичні обчислення в їхній основі можливо втілювати за допомогою оптичних обчислень.^[72]

Пов'язані з ДКЧП диференційовні структури пам'яті

Окрім довгої короткочасної пам'яті (ДКЧП), інші підходи також додали диференційовну пам'ять до рекурентних функцій. Наприклад:

Диференційовні дії проштовхування та виштовхування для мереж альтернативної пам'яті, звані нейронними стековими машинами (Шаблон:Lang-en)^[73]^[74]
Мережі пам'яті, в яких зовнішнє диференційовне сховище керівної мережі знаходиться у швидких вагах іншої мережі^[75]
Забувальні вентилі ДКЧП^[76]
Автореферентні РНМ з особливими вузлами виходу для адресування та швидкого маніпулювання власними вагами РНМ на диференційовний манір (внутрішнє сховище)^[77]^[78]
Навчання перетворення з необмеженою пам'яттю^[79]

Нейронні машини Тюрінга

Шаблон:Main

Нейронні машини Тюрінга (НМТ, Шаблон:Lang-en)^[80] спаровують мережі ДКЧП із зовнішніми ресурсами пам'яті, з якими вони можуть взаємодіяти за допомогою процесів уваги (Шаблон:Lang-en). Ця зв'язана система аналогічна машині Тюрінга, але диференціюється наскрізно, що дозволяє ефективно тренувати її градієнтним спуском. Попередні результати показують, що нейронні машини Тюрінга можуть висновувати з прикладів входу та виходу прості алгоритми, такі як копіювання, впорядковування та асоціативне пригадування.

Шаблон:Нп (Шаблон:Lang-en) — це розширення НМТ. На задачах обробки послідовностей вони перевершили нейронні машини Тюрінга, системи довгої короткочасної пам'яті та мережі з пам'яттю.^[81]^[82]^[83]^[84]^[85]

Семантичне гешування

Підходи, які подають попередній досвід безпосередньо, і використовують схожий досвід для формування локальної моделі, часто називають методами найближчого сусіда або k-найближчих сусідів.^[86] В семантичному гешуванні (Шаблон:Lang-en) корисне глибоке навчання,^[87] де з великого набору документів отримують глибоку графову модель векторів кількостей слів.^[88] Документи відображуються на комірки пам'яті таким чином, що семантично схожі документи розташовуються за близькими адресами. Потім документи, схожі на документ із запиту, можливо знаходити шляхом простого доступу до всіх адрес, що відрізняються від адреси документа із запиту лише кількома бітами. На відміну від Шаблон:Нп, що оперує 1000-бітними адресами, семантичне гешування працює на 32- або 64-бітних адресах, що зустрічаються в традиційній комп'ютерній архітектурі.

Вказівникові мережі

Глибокі нейронні мережі можливо потенційно поліпшувати поглибленням та скороченням параметрів, за збереження здатності до тренування. В той час як тренування надзвичайно глибоких (наприклад, завглибшки в мільйон шарів) нейронних мереж може бути непрактичним, ЦП-подібні архітектури, такі як вказівникові мережі (Шаблон:Lang-en),^[89] та нейронні машини з довільним доступом (Шаблон:Lang-en),^[90] долають це обмеження завдяки застосуванню зовнішньої пам'яті з довільним доступом та інших складових, що зазвичай належать до комп'ютерної архітектури, таких як регістри, АЛП та вказівники. Такі системи працюють на векторах розподілів імовірностей, що зберігаються в комірках пам'яті та регістрах. Таким чином, ця модель повністю диференційовна, й тренується з краю в край. Ключовою характеристикою цих моделей є те, що їхня глибина, розмір їхньої короткочасної пам'яті та число параметрів можливо змінювати незалежно.

Гібриди

Кодувально—декодувальні мережі

Кодувально-декодувальні системи (Шаблон:Lang-en) ґрунтуються на нейронних мережах, що відображують високоструктурований вхід на високоструктурований вихід. Цей підхід виник у контексті машинного перекладу,^[91]^[92]^[93] де вхід та вихід є писаними реченнями двома природними мовами. В тій праці використовували РНМ або ЗНМ ДКЧП як кодувальник для отримання зведення про вхідне речення, і це зведення декодували умовною РНМ-моделлю мови для продукування перекладу.^[94] Для цих систем є спільними будівельні блоки: вентильні (Шаблон:Lang-en) РНМ та ЗНМ, і треновані механізми уваги.

Інші типи

Миттєво треновані

Шаблон:Нп (МТНН, Шаблон:Lang-en) були натхнені явищем короткочасного навчання (Шаблон:Lang-en), яке, здається, відбувається миттєво. У цих мережах ваги прихованого шару та шару виходу відображаються безпосередньо з даних тренувального вектора. Зазвичай вони працюють з двійковими даними, але існують версії й для неперервних даних, які потребують невеликої додаткової обробки.

Спайкові

Шаблон:Нп (СНМ, Шаблон:Lang-en) явно враховують хронометраж вхідних даних. Вхід та вихід цієї мережі зазвичай подано у вигляді рядів спайків (дельта-функції або складнішого вигляду). СНМ може обробляти інформацію в часовій області (сигналів, які змінюються в часі). Їх часто втілюють як рекурентні мережі. СНМ також є одним із видів Шаблон:Нп.^[95]

Спайкові нейронні мережі з затримками аксональної провідності демонструють поліхронізацію, і відтак можуть мати дуже велику ємність пам'яті.^[96]

СНМ та часові кореляції нейронних збірок у таких мережах використовували для моделювання поділу фігур/тла та з'єднування областей у зоровій системі.

Просторові

Шаблон:Main

Просторові нейронні мережі (ПНМ, Шаблон:Lang-en) становлять надкатегорію спеціалізованих нейронних мереж (НМ) для подавання та передбачування географічних явищ. Вони загалом покращують як статистичну точність, так і надійність а-просторових/класичних НМ, коли обробляють геопросторові набори даних, а також інших просторових (статистичних) моделей (наприклад, просторових регресійних моделей), коли змінні цих геопросторових наборів даних описують нелінійні зв'язки.^[97]^[98]^[99] Прикладами ПНМ є поросторові нейронні мережі OSFA, SVANN та GWNN.

Неокогнітрон

Неокогнітрон (Шаблон:Lang-en) — це ієрархічна багатошарова мережа, змодельована на основі зорової кори. Він використовує кілька типів вузлів (первинно два, звані Шаблон:Нп, Шаблон:Lang-en, та Шаблон:Нп, Шаблон:Lang-en, клітинами) як каскадну модель для використання в задачах розпізнавання образів.^[100]^[101]Шаблон:Sfn Локальні ознаки виділяють S-клітини, деформацію яких допускають C-клітини. Локальні ознаки у вході поступово інтегруються та класифікуються на вищих шарах.Шаблон:Sfn Серед різних видів неокогнітронівШаблон:Sfn є системи, які можуть виявляти декілька образів в одному вході за допомогою зворотного поширення для досягнення Шаблон:Нп.Шаблон:Sfn Його використовували для завдань розпізнавання образів, він надихнув згорткові нейронні мережі.^[102]

Змішані ієрархічно—глибокі моделі

Змішані ієрархічно-глибокі моделі (Шаблон:Lang-en) компонують глибокі мережі з непараметричними баєсовими моделями. Ознак можливо навчатися із застосуванням таких глибоких архітектур як ГМП,^[103] глибокі машини Больцмана (ГМБ),^[104] глибокі автокодувальники,^[105] згорткові варіанти,^[106]^[107] ппОМБ,^[108] глибокі кодувальні мережі,^[109] ГМП з розрідженим навчанням ознак,^[110] РНМ,^[111] умовні ГМП,^[112] знешумлювальні автокодувальники.^[113] Це забезпечує краще подання, швидше навчання та точніше класифікування з даними високої вимірності. Проте ці архітектури слабкі в навчанні нововведених класів на кількох прикладах, оскільки всі вузли мережі залучено до подання входу (Шаблон:Якір2) і мусить бути підлаштовувано разом (високий ступінь свободи). Обмеження ступеню свободи знижує кількість параметрів для навчання, допомагаючи навчанню нових класів з кількох прикладів. Ієрархічні баєсові (ІБ) моделі дозволяють навчатися з кількох прикладів, наприклад^[114]^[115]^[116]^[117]^[118] для комп'ютерного бачення, статистики та когнітивної науки.

Змішані ІГ-архітектури мають на меті поєднання характеристик як ІБ, так і глибоких мереж. Змішана архітектура ІПД-ГМБ це Шаблон:Нп (ІПД, Шаблон:Lang-en) як ієрархічна модель, що включає архітектуру ГМБ. Це повна породжувальна модель, узагальнювана з абстрактних понять, що течуть крізь шари цієї моделі, здатна синтезувати нові приклади нововведених класів, що виглядають «досить» природно. Всіх рівнів навчаються спільно, зведенням до максимуму функції внеску спільної логарифмічної ймовірності.^[119]

У ГМБ з трьома прихованими шарами ймовірність видимого входу ''Шаблон:Mvar'' становить

p (𝝂, ψ) = \frac{1}{Z} \sum_{h} \exp (\sum_{i j} W_{i j}^{(1)} ν_{i} h_{j}^{1} + \sum_{j ℓ} W_{j ℓ}^{(2)} h_{j}^{1} h_{ℓ}^{2} + \sum_{ℓ m} W_{ℓ m}^{(3)} h_{ℓ}^{2} h_{m}^{3}),

де $𝒉 = {𝒉^{(1)}, 𝒉^{(2)}, 𝒉^{(3)}}$ — набір прихованих вузлів, а $ψ = {𝑾^{(1)}, 𝑾^{(2)}, 𝑾^{(3)}}$ — параметри моделі, що подають умови симетричної взаємодії видимі—приховані та приховані—приховані.

Навчена модель ГМБ це неорієнтована модель, яка визначає спільний розподіл $P (ν, h^{1}, h^{2}, h^{3})$ . Одним зі способів вираження навченого є умовна модель $P (ν, h^{1}, h^{2} ∣ h^{3})$ та апріорний член $P (h^{3})$ .

Тут $P (ν, h^{1}, h^{2} ∣ h^{3})$ подає умовну модель ГМБ, яку можливо розглядати як двошарову ГМБ, але з членами зміщення, заданими станами $h^{3}$ :

P (ν, h^{1}, h^{2} ∣ h^{3}) = \frac{1}{Z (ψ, h^{3})} \exp (\sum_{i j} W_{i j}^{(1)} ν_{i} h_{j}^{1} + \sum_{j ℓ} W_{j ℓ}^{(2)} h_{j}^{1} h_{ℓ}^{2} + \sum_{ℓ m} W_{ℓ m}^{(3)} h_{ℓ}^{2} h_{m}^{3}) .

Глибокі передбачувальні кодувальні мережі

Глибока передбачувальна кодувальна мережа (ГПКМ, Шаблон:Lang-en) — це передбачувальна схема кодування, що використовує спадну (Шаблон:Lang-en) інформацію для емпіричного підлаштовування апріорних, необхідних для процедури висхідного (Шаблон:Lang-en) висновування, засобами глибокої локально з'єднаної породжувальної моделі. Це працює шляхом виділяння розріджених ознак зі спостережень, що змінюються в часі, із застосуванням лінійної динамічної моделі. Потім для навчання інваріантних подань ознак застосовується стратегія агрегування (Шаблон:Lang-en). Ці блоки компонуються, щоби сформувати глибоку архітектуру, і тренуються жадібним пошаровим некерованим навчанням. Шари утворюють щось на зразок марковського ланцюга, такого, що стани на будь-якому шарі залежать лише від наступного та попереднього шарів.

ГПКМ передбачують подання шару, використовуючи спадний підхід із застосуванням інформації з вищого шару та часових залежностей від попередніх станів.^[120]

ГПКМ можливо розширювати таким чином, щоби утворювати згорткову мережу.^[120]

Багатошарова ядрова машина

Багатошарові ядрові машини (БЯМ, Шаблон:Lang-en) — це спосіб навчання високонелінійних функцій за допомогою ітеративного застосування слабко нелінійних ядер. Вони використовують Шаблон:Нп (ЯМГК, Шаблон:Lang-en)^[121] як метод для жадібного пошарового передтренувального кроку глибокого некерованого навчання.^[122]

$ℓ + 1$ -й шар навчається подання попереднього шару $ℓ$ , виділяючи $n_{l}$ головних компонент (ГК, Шаблон:Lang-en) виходу проєкційного шару $l$ в області ознак, що виводить ядро. Щоби знижувати розмірність уточненого подання на кожному шарі, керована стратегія обирає найінформативніші серед ознак, виділених ЯМГК. Процес такий:

вишикувати $n_{ℓ}$ ознак відповідно до їхньої взаємної інформації з мітками класів;
для різних значень K та $m_{ℓ} \in {1, \dots, n_{ℓ}}$ обчислити рівень похибки класифікації методом k-найближчих сусідів (k-НС, англ. K-nearest neighbor, K-NN), використовуючи лише $m_{l}$ найінформативніших ознак на затверджувальному наборі;
значення $m_{ℓ}$ з яким класифікатор досяг найнижчого рівня похибки, визначає число ознак, які потрібно зберегти.

Метод ЯМГК як будівельні блоки для БЯМ супроводжують деякі недоліки.

Для розуміння усного мовлення розробили простіший спосіб застосування ядрових машин для глибокого навчання.^[123] Головна ідея полягає у використанні ядрової машини для наближення неглибокої нейронної мережі з нескінченним числом прихованих вузлів, і подальшому застосуванні глибокої складальної мережі для зрощування виходу цієї ядрової машини та сирого входу при побудові наступного, вищого рівня ядрової машини. Число рівнів у цій глибокій опуклій мережі є гіперпараметром системи в цілому, який повинен визначатися перехресним затверджуванням.

Див. також

Шаблон:Div col

Шаблон:Div col end

Примітки

Шаблон:Примітки

Література

↑ Шаблон:Cite news Цитата: «… „Дивно, що після сотні років сучасних нейронаукових досліджень ми досі не знаємо базових функцій обробки інформації нейроном“, зазначив Барлетт Мел…»
↑ Шаблон:Cite news Цитата: «…„Починаючи з 1980-х років, багато нейробіологів вірили, що вони володіють ключем до того, як нарешті почати розуміти роботу мозку. Але ми надали переконливі свідчення того, що мозок може не кодувати інформацію за допомогою точних моделей діяльності.“…»
↑ Шаблон:Cite news Цитата: «…„Наша робота передбачає, що мозкові механізми для формування такого роду асоціацій можуть бути надзвичайно подібними у равликів і вищих організмів… Ми не повністю розуміємо навіть дуже прості види навчання у цих тварин.“…»
↑ Шаблон:Cite news Цитата: «…Маккормік сказав, що майбутні дослідження та моделі роботи нейронів у мозку повинні враховувати змішану аналогово-цифрову природу зв'язку. Лише завдяки глибокому розумінню цього змішаного способу передачі сигналу можна досягти дійсно глибокого розуміння мозку та його розладів, сказав він…»
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ ^8,0 ^8,1 Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite arXiv
↑ Шаблон:Cite blog
↑ Шаблон:Cite web
↑ Шаблон:Cite web
↑ Шаблон:Cite web
↑ Шаблон:Cite web, глава з інтернетпосібника Шаблон:Нп
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite conference
↑ Шаблон:Cite journal
↑ Шаблон:Cite web
↑ Шаблон:Cite web Шаблон:Webarchive
↑ Шаблон:Cite journal
↑ Шаблон:Cite web
↑ Шаблон:Cite web
↑ Шаблон:Citation
↑ Шаблон:Cite conference
↑ Шаблон:Cite journal
↑ Шаблон:Cite book
↑ Шаблон:Cite book
↑ ^31,0 ^31,1 ^31,2 Шаблон:Cite book
↑ ^32,0 ^32,1 Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite conference
↑ Шаблон:Cite journal
↑ Шаблон:Cite book
↑ Шаблон:Cite journal
↑ Шаблон:Cite report
↑ Шаблон:Cite report
↑ Шаблон:Cite book
↑ Шаблон:Cite journal
↑ Шаблон:Cite book
↑ Шаблон:Cite journal
↑ Шаблон:Cite report
↑ Шаблон:Cite journal
↑ Шаблон:Cite thesis
↑ Шаблон:Cite book
↑ ^52,0 ^52,1 Шаблон:Cite journal
↑ Шаблон:Cite book
↑ Шаблон:Cite conference
↑ Шаблон:Cite journal
↑ Шаблон:Cite web
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite conference
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite web Шаблон:Webarchive
↑ Шаблон:Cite web
↑ Шаблон:Cite book
↑ Шаблон:Cite web Шаблон:Webarchive
↑ Шаблон:Cite arXiv
↑ Шаблон:Cite arXiv
↑ Шаблон:Cite arXiv
↑ Шаблон:Cite web
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite conference
↑ Шаблон:Cite journal Шаблон:Webarchive
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite book
↑ Шаблон:Cite journal
↑ Шаблон:Cite arXiv
↑ Шаблон:Cite arXiv
↑ Шаблон:Cite news
↑ Шаблон:Cite news
↑ Шаблон:Cite web
↑ Шаблон:Cite journal
↑ Шаблон:Cite web
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite arXiv
↑ Шаблон:Cite arXiv
↑ Шаблон:Cite arXiv
↑ Шаблон:Cite conference
↑ Шаблон:Cite conference
↑ Шаблон:Cite arXiv
↑ Шаблон:Cite journal
↑ Шаблон:Cite web Шаблон:Webarchive вільно доступний інтернетпідручник
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite book
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal Шаблон:Webarchive
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite book
↑ Шаблон:Cite conference
↑ Шаблон:Cite book
↑ Шаблон:Cite journal Шаблон:Webarchive
↑ Шаблон:Cite journal Шаблон:Webarchive
↑ Шаблон:Cite journal Шаблон:Webarchive
↑ Шаблон:Cite book
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite book
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ ^120,0 ^120,1 Шаблон:Cite arXiv
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal
↑ Шаблон:Cite journal

[1] Шаблон:Cite news Цитата: «… „Дивно, що після сотні років сучасних нейронаукових досліджень ми досі не знаємо базових функцій обробки інформації нейроном“, зазначив Барлетт Мел…»

[2] Шаблон:Cite news Цитата: «…„Починаючи з 1980-х років, багато нейробіологів вірили, що вони володіють ключем до того, як нарешті почати розуміти роботу мозку. Але ми надали переконливі свідчення того, що мозок може не кодувати інформацію за допомогою точних моделей діяльності.“…»

[3] Шаблон:Cite news Цитата: «…„Наша робота передбачає, що мозкові механізми для формування такого роду асоціацій можуть бути надзвичайно подібними у равликів і вищих організмів… Ми не повністю розуміємо навіть дуже прості види навчання у цих тварин.“…»

[4] Шаблон:Cite news Цитата: «…Маккормік сказав, що майбутні дослідження та моделі роботи нейронів у мозку повинні враховувати змішану аналогово-цифрову природу зв'язку. Лише завдяки глибокому розумінню цього змішаного способу передачі сигналу можна досягти дійсно глибокого розуміння мозку та його розладів, сказав він…»

[ivak1968-5] Шаблон:Cite journal

[ivak1971-6] Шаблон:Cite journal

[kondo2008-7] Шаблон:Cite journal

[bengio-8] 8,0 ^8,1 Шаблон:Cite journal

[9] Шаблон:Cite journal

[10] Шаблон:Cite journal

[VAE-11] Шаблон:Cite arXiv

[gan_faces-12] Шаблон:Cite blog

[13] Шаблон:Cite web

[14] Шаблон:Cite web

[15] Шаблон:Cite web

[16] Шаблон:Cite web, глава з інтернетпосібника Шаблон:Нп

[:1-17] Шаблон:Cite journal

[:0-18] Шаблон:Cite journal

[Weng19932-19] Шаблон:Cite conference

[FUKU1980-20] Шаблон:Cite journal

[LeCun-21] Шаблон:Cite web

[deeplearning-22] Шаблон:Cite web Шаблон:Webarchive

[LECUN1989-23] Шаблон:Cite journal

[lecun2016slides-24] Шаблон:Cite web

[STANCNN-25] Шаблон:Cite web

[26] Шаблон:Citation

[deepdream-27] Шаблон:Cite conference

[28] Шаблон:Cite journal

[29] Шаблон:Cite book

[30] Шаблон:Cite book

[ref172-31] 31,0 ^31,1 ^31,2 Шаблон:Cite book

[ref162-32] 32,0 ^32,1 Шаблон:Cite journal

[ref18-33] Шаблон:Cite journal

[ref19-34] Шаблон:Cite journal

[ref26-35] Шаблон:Cite journal

[ref27-36] Шаблон:Cite journal

[ref28-37] Шаблон:Cite journal

[shedding2-38] Шаблон:Cite conference

[SCHOLARDBNS-39] Шаблон:Cite journal

[40] Шаблон:Cite book

[41] Шаблон:Cite journal

[42] Шаблон:Cite report

[43] Шаблон:Cite report

[44] Шаблон:Cite book

[45] Шаблон:Cite journal

[46] Шаблон:Cite book

[47] Шаблон:Cite journal

[48] Шаблон:Cite report

[49] Шаблон:Cite journal

[50] Шаблон:Cite thesis

[51] Шаблон:Cite book

[lstm-52] 52,0 ^52,1 Шаблон:Cite journal

[53] Шаблон:Cite book

[54] Шаблон:Cite conference

[55] Шаблон:Cite journal

[56] Шаблон:Cite web

[57] Шаблон:Cite journal

[58] Шаблон:Cite journal

[59] Шаблон:Cite conference

[60] Шаблон:Cite journal

[61] Шаблон:Cite journal

[62] Шаблон:Cite journal

[63] Шаблон:Cite web Шаблон:Webarchive

[64] Шаблон:Cite web

[65] Шаблон:Cite book

[66] Шаблон:Cite web Шаблон:Webarchive

[Weston,_Jason_14102-67] Шаблон:Cite arXiv

[68] Шаблон:Cite arXiv

[69] Шаблон:Cite arXiv

[Hinton,_Geoffrey_E_19842-70] Шаблон:Cite web

[71] Шаблон:Cite journal

[72] Шаблон:Cite journal

[S._Das,_C.L._Giles_p._79-73] Шаблон:Cite conference

[Mozer,_M._C._1993_pp._863-870-74] Шаблон:Cite journal Шаблон:Webarchive

[ReferenceC-75] Шаблон:Cite journal

[F._Gers,_N._Schraudolph_2002-76] Шаблон:Cite journal

[J._Schmidhuber_pages_191-195-77] Шаблон:Cite book

[Hochreiter,_Sepp_2001-78] Шаблон:Cite journal

[Grefenstette,_Edward_1506-79] Шаблон:Cite arXiv

[Graves,_Alex_14102-80] Шаблон:Cite arXiv

[:02-81] Шаблон:Cite news

[82] Шаблон:Cite news

[83] Шаблон:Cite web

[84] Шаблон:Cite journal

[85] Шаблон:Cite web

[86] Шаблон:Cite journal

[87] Шаблон:Cite journal

[Le_2014-88] Шаблон:Cite arXiv

[89] Шаблон:Cite arXiv

[90] Шаблон:Cite arXiv

[91] Шаблон:Cite conference

[92] Шаблон:Cite conference

[93] Шаблон:Cite arXiv

[94] Шаблон:Cite journal

[95] Шаблон:Cite web Шаблон:Webarchive вільно доступний інтернетпідручник

[pmid16378515-96] Шаблон:Cite journal

[Morer_et_al._(2020)-97] Шаблон:Cite journal

[Gupta_et_al._(2021)-98] Шаблон:Cite journal

[Hagenauer_et_al._(2022)-99] Шаблон:Cite journal

[100] Шаблон:Cite book

[101] Шаблон:Cite journal

[102] Шаблон:Cite journal

[hinton2006-103] Шаблон:Cite journal

[ref3-104] Шаблон:Cite journal Шаблон:Webarchive

[ref15-105] Шаблон:Cite journal

[ref39-106] Шаблон:Cite journal

[ref40-107] Шаблон:Cite book

[ref32-108] Шаблон:Cite conference

[ref41-109] Шаблон:Cite book

[ref42-110] Шаблон:Cite journal Шаблон:Webarchive

[ref43-111] Шаблон:Cite journal Шаблон:Webarchive

[ref44-112] Шаблон:Cite journal Шаблон:Webarchive

[ref45-113] Шаблон:Cite book

[ref34-114] Шаблон:Cite journal

[ref37-115] Шаблон:Cite journal

[ref46-116] Шаблон:Cite book

[ref47-117] Шаблон:Cite journal

[ref48-118] Шаблон:Cite journal

[ref38-119] Шаблон:Cite journal

[ref56-120] 120,0 ^120,1 Шаблон:Cite arXiv

[ref60-121] Шаблон:Cite journal

[ref59-122] Шаблон:Cite journal

[123] Шаблон:Cite journal

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]

[59]

[60]

[61]

[62]

[63]

[64]

[65]

[66]

[67]

[68]

[69]

[70]

[71]

[72]

[73]

[74]

[75]

[76]

[77]

[78]

[79]

[80]

[81]

[82]

[83]

[84]

[85]

[86]

[87]

[88]

[89]

[90]

[91]

[92]

[93]

[94]

[95]

[96]

[97]

[98]

[99]

[100]

Типи штучних нейронних мереж

Прямого поширення

Метод групового урахування аргументів

Автокодувальник

Імовірнісний

Часова затримка

Згорткова

Глибока складальна мережа

Тензорні глибокі складальні мережі

Регуляторний зворотній зв'язок

Радіальні базисні функції (РБФ)

Як працюють РБМ

Радіальна базисна функція

Архітектура

Тренування

Узагальнена регресійна нейронна мережа

Глибока мережа переконань

Рекурентна нейронна мережа

Повнорекурентна

Гопфілда

Машина Больцмана

Самоорганізаційна карта

Навчане векторне квантування

Проста рекурентна

Резервуарне обчислення

Відлуння стану

Довга короткочасна пам'ять

Двонапрямна

Ієрархічна

Стохастична

Генетичний масштаб

Модульна

Комітет машин

Асоціативна

Фізична

Динамічна

Каскадна

Нейронечітка

Композиційна шаблоностворювальна

Мережі з пам'яттю

Асоціативна пам'ять з одного погляду

Ієрархічна часова пам'ять

Голографічна асоціативна пам'ять

Пов'язані з ДКЧП диференційовні структури пам'яті

Нейронні машини Тюрінга

Семантичне гешування

Вказівникові мережі

Гібриди

Кодувально—декодувальні мережі

Інші типи

Миттєво треновані

Спайкові

Просторові

Неокогнітрон

Змішані ієрархічно—глибокі моделі

Глибокі передбачувальні кодувальні мережі

Багатошарова ядрова машина

Див. також

Примітки

Література

Навігаційне меню

Пошук