Результати пошуку
Перейти до навігації
Перейти до пошуку
- ...ання#GLUE|Загальне оцінювання розуміння мови (GLUE)]], на якому нові мовні моделі досягали кращих результатів, ніж людина. На момент випуску MMLU більшість і [[Категорія:Великі мовні моделі]] ...5 КБ (198 слів) - 15:21, 20 вересня 2024
- ...раметрів, які були «попередньо навчені» на великому корпусі. LLM — це моделі загального призначення, які відмінно справляються з широким спектром завдан Великі мовні моделі найчастіше використовують архітектуру типу [[Трансформер (архітектура глибо ...10 КБ (269 слів) - 01:49, 14 червня 2024
- ...від числа вузлів у контакті. Якщо є мовні бар'єри, або інші причини, чому великі частини мережі не з'єднані з іншими частинами, вплив може бути менший. == Модифіковані моделі == ...13 КБ (706 слів) - 05:07, 18 червня 2022
- ...о впасти на ядра, що привело до появи у 1913 році [[Постулати Бора|атомної моделі Бора]]<ref name="nuclphys">[http://nuclphys.sinp.msu.ru/introduction/xx1.ht Протони мають заряд одного знаку, тому на них діють великі кулонівські сили, що намагаються виштовхнути їх з ядер. Той факт, що, попри ...32 КБ (329 слів) - 19:00, 14 березня 2025
- ...ltitask_learners.pdf|publisher=OpenAI blog|quote=Ми демонструємо, що мовні моделі можуть виконувати поточні завдання в постановці з нулем поглядів — без ...|access-date=2023-08-16}}</ref> Підказка може містити кілька прикладів для моделі, щоби вчитися з них, як-от «maison -> house, chat -> cat, chien ->»,<ref>{{ ...80 КБ (4782 слова) - 16:46, 24 грудня 2024
- Серед вловимих звуків варто особливо виділити фонетичні, [[Мовний звук|мовні звуки]] й [[фонема|фонеми]] (з яких складається усне [[мовлення]]) і [[музи ...ля врахування втрат енергії при деформації середовища слід використовувати моделі, що враховують в'язкість. При поширенні гармонічних хвиль в'язкі втрати час ...74 КБ (641 слово) - 06:56, 8 березня 2025
- ...ного навчання застосовували до багатьох галузей, серед яких [[великі мовні моделі]], [[комп'ютерне бачення]], [[розпізнавання мовлення]], [[фільтрування елек ...Walter Pitts}} та [[Воррен Маккалох]], які запропонували ранні математичні моделі нейронних мереж для розробки алгоритмів, що імітують процеси людського мисл ...198 КБ (9572 слова) - 14:26, 3 лютого 2025
- ...56|class=cs.LG|language=en}}</ref> ШНМ загалом розглядають як низькоякісні моделі функціювання мозку.<ref>{{Cite web |date=2 листопада 2022 |title=Study urge ...кції. Глибокі моделі (ШРВ > 2) здатні виділяти кращі ознаки, ніж неглибокі моделі, й отже, додаткові шари допомагають ефективно навчатися ознак. ...254 КБ (15 627 слів) - 07:44, 28 грудня 2024