Вентильний рекурентний вузол
Ве́нтильні рекуре́нтні вузли́ (ВРВ, Шаблон:Lang-en) — це вентильний механізм у рекурентних нейронних мережах, представлений 2014 року.[1] Вони подібні до довгої короткочасної пам'яті з вентилем забування,[2] але мають менше параметрів, оскільки не мають вентиля виходу.[3]
Було виявлено, що їхня продуктивність на моделюванні поліфонічної музики та мовленнєвого сигналу аналогічна продуктивності ДКЧП.[4]
Однак, як показали Гейл Вейз (Шаблон:Lang-en), Іов Голдберг (Шаблон:Lang-en) та Еран Яхав (Шаблон:Lang-en), ДКЧП «суттєво сильніше» ВРВ, бо може виконувати необмежений підрахунок, неможливий для ВРВ.[5] Ось чому ВРВ не може вивчити прості мови, з якими впоралась ДКЧП.[5]
Аналогічно, як показали Денні Бритз (Шаблон:Lang-en), Анна Голді (Шаблон:Lang-en, Мінь-Тханг Луонг (Шаблон:Lang-en) і Куок Лей (Шаблон:Lang-en) з Google Brain, вузли ДКЧП незмінно перевершують вузли ВРВ у «передовому широкомасштабному аналізі варіацій архітектури для нейронного машинного перекладу».
Архітектура
Символ позначає добуток Адамара. Початкове значення .
Повний рекурентний вузол

Повний рекурентний вузол працює наступним чином. На вхід подаються значення вектору входу та значення виходу (при , вектор виходу ). По ним обчислюється претендент на нове значення виходу — вектор вузла скидання (Шаблон:Lang-en) , який обчислюється як функція активації (зазвичай сигмоїд) від матричного виразу по параметрам , та . Незалежно, подібним чином, обчислюється вектор вузла уточнення (Шаблон:Lang-en) . Цей вектор містить значення, які визначають, чи варто залишити значення зі старого вектору, чи взяти нове значення. Фактично, це набір «вентилів» (Шаблон:Lang-en), які «пропускають» або старе, або нове значення. Далі обчислюється вектор виходу , в якому з ймовірністю береться старе значення з вектору , або з ймовірністю обчислюється нове значення.[6]
Формули для обчислень наступні:
Змінні
- : вектор входу
- : вектор виходу
- : вектор вузла уточнення
- : вектор вузла скидання
- , та : матриці та вектор параметрів
- : В оригіналі є сигмоїдною функцією.
- : В оригіналі є гіперболічним тангенсом.