MNIST (база даних)

База даних MNIST (скорочення від Mixed National Institute of Standards and Technology) — об'ємна база даних зразків рукописного написання цифр[1]. Є стандартом, запропонованим Національним інститутом стандартів і технологій США з метою калібрування і зіставлення методів розпізнавання зображень за допомогою машинного навчання, в першу чергу на основі штучних нейронних мереж[2][3]. База даних містить 60000 зображень для навчання і 10000 зображень для тестування.
Дані складаються з заздалегідь підготовлених прикладів зображень, отриманих з рукописних документів шляхом обробки чорно-білих зразків символів NIST розміром пікселів. Творці бази даних NIST, в свою чергу, використовували набір зразків з Бюро перепису населення США, до якого були додані ще тестові зразки, написані студентами американських університетів. Зразки з набору з NIST були нормалізовані, пройшли згладжування та приведення до напівтонового зображенню розміром пікселів.
Рекордні результати машинного розпізнавання на базі MNIST були досягнуті на згорткових нейронних мережах, рівень помилки був доведений до 0,23 %.
Результати обробки для різних систем
У таблиці наведені приклади результатів машинного навчання в різних системах класифікації зображень.
| Тип | Структура | Спотворення | Попередня обробка | Помилка (%) |
|---|---|---|---|---|
| Лінійний класифікатор | Однорівневий перцептрон | Шаблон:No | Шаблон:No | 12.0 |
| Лінійний класифікатор | Попарний лінійний класифікатор | Шаблон:No | Вирівнювання | 7.6 |
| Метод найближчих k-сусідів | К-ПН з нелінійною деформацією (P2DHMDM) | Шаблон:No | Shiftable edges | 0.52 |
| Шаблон:Не перекладено | Обробка залишків на основі гаароподібних ознак | Шаблон:No | Гаароподібна ознака | 0.87 |
| Нелінійний класифікатор | 40 PCA + квадратичний класифікатор | Шаблон:No | Шаблон:No | 3.3 |
| Метод опорних векторів | Віртуальна система опорних векторів, град-9 поли, 2-пікселя jittered | Шаблон:No | Вирівнювання | 0.56 |
| Нейронна мережа | 2-рівнева мережа 784-800-10 | Шаблон:No | Шаблон:No | 1.6 |
| Нейронна мережа | 2-рівнева мережа 784-800-10 | Пружні деформації | Шаблон:No | 0.7 |
| Глибока нейронна мережа | 6-рівнева мережа 784-2500-2000-1500-1000-500-10 | Пружні деформації | Шаблон:No | 0.35 |
| Згорткова нейронна мережа | 6-рівнева мережа 784-40-80-500-1000-2000-10 | Шаблон:No | Розширення даних для навчання | 0.31 |
| Згорткова нейронна мережа | 6-рівнева мережа 784-50-100-500-1000-10-10 | Шаблон:No | Розширення даних для навчання | 0.27 |
| Згорткова нейронна мережа | Ансамбль з 35 CNN-мереж, 1-20-С-40-С-150-10 | Пружні деформації | З нормалізацією | 0.23 |
| Згорткова нейронна мережа | Ансамбль з 5 CNN-мереж, 6-784-50-100-500-1000-10-10 | рівнів Шаблон:No | Розширення даних для навчання | 0.21 |
Примітки
Див. також
Джерела
- MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges Шаблон:Webarchive — Домашня сторінка бази даних
- Neural Net for Handwritten Digit Recognition in JavaScript Шаблон:Webarchive — Реалізація нейронної мережі на JavaScript для розпізнавання цифр написаних від руки на основі бази MNIST