Гаароподібна ознака

Матеріал з testwiki
Версія від 01:10, 16 квітня 2024, створена imported>BunykBot (автоматична заміна {{Не перекладено}} вікі-посиланнями на перекладені статті)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Га́ароподібні озна́ки (Шаблон:Lang-en) — це ознаки у цифровому зображенні, які використовують для Шаблон:Нп. Своєю назвою вони зобов'язані своїй інтуїтивній схожості з гааровими вейвлетами, їх використовували в першому реальночасовому виявлячі обличь.[1]

Історично склалося так, що робота лише з яскравостями зображення (тобто значеннями RGB пікселів для всіх та кожного пікселя зображення) робила завдання обчислення ознак обчислювально витратним. У публікації Папаґеорґіу зі співавт.[2] було обговорено роботу з альтернативним набором ознак на основі гаарових вейвлетів замість звичайних яскравостей зображення. Шаблон:Нп та Шаблон:Нп[1] пристосували цю ідею використання гаарових вейвлетів та розробили так звані гаароподібні ознаки. Гаароподібна ознака розглядає суміжні прямокутні області в певному місці у вікні виявляння, підсумовує яскравості пікселів у кожній з областей, та обчислює різницю між цими сумами. Цю різницю відтак використовують для Шаблон:Нп фрагментів зображення. Наприклад, для людських обличь зазвичай спостерігають те, що на всіх обличчях область очей темніша за область щік. Таким чином, загальна гаарова ознака для виявляння обличь — це набір із двох суміжних прямокутників, які лежать на областях очей та щік. Положення цих прямокутників визначають відносно вікна виявляння, яке діє як обмежувальна рамка для цільового об'єкта (в цьому випадку обличчя).

На етапі виявляння в системі Віоли — Джонса виявляння об'єктів вікно цільового розміру переміщують над вхідним зображенням, і для кожного фрагменту зображення обчислюють гаароподібну ознаку. Цю різницю потім порівнюють із навченим порогом, який відокремлює необ'єкти від об'єктів. Оскільки така гаароподібна ознака це лише слабенький учень чи класифікатор (її якість виявляння ледве вища за випадкове гадання), щоб описати об'єкт із достатньою точністю, необхідна велика кількість гаароподібних ознак. Відтак, щоби утворити сильного учня чи класифікатор, гаароподібні ознаки в системі Віоли — Джонса виявляння об'єктів організовано в дещо, зване каскадом класифікаторів (Шаблон:Lang-en).

Ключовою перевагою гаароподібної ознаки над більшістю інших ознак є швидкість її обчислення. Завдяки використанню інтегральних зображень, гаароподібну ознаку будь-якого розміру можливо обчислити за незмінний час (приблизно 60 інструкцій мікропроцесора для 2-прямокутникової ознаки).

Прямокутні гаароподібні ознаки

Приклад ранніх гаароподібних ознак, які використовували Віола та Джонс 2001 року.

Просту прямокутну гаароподібну ознаку можливо визначити як різницю сум пікселів областей усередині прямокутника, який може бути в будь-якому місці та масштабі на первинному зображенні. Такий варійований набір ознак називають 2-прямокутниковою ознакою (Шаблон:Lang-en). Віола та Джонс також визначили 3-прямокутникові та 4-прямокутникові ознаки. Ці значення вказують на певні характеристики певної області зображення. Кожен тип ознак може вказувати на наявність (або відсутність) певних характеристик на зображенні, таких як контури або зміни текстури. Наприклад, 2-прямокутникова ознака може вказувати, де проходить межа між темною та світлою областями.

Швидке обчислювання гаароподібних ознак

Знаходження суми заштрихованої прямокутної області

Одним із внесків Віоли та Джонса було застосування таблиць сумарних площ,[3] які вони назвали інтегральними зображеннями (Шаблон:Lang-en). Інтегральні зображення можливо визначити як двовимірні таблиці пошуку у вигляді матриці того ж розміру, що й первинне зображення. Кожен елемент інтегрального зображення містить суму всіх пікселів, розташованих у вищій лівішій області первинного зображення (відносно положення елемента). Це дозволяє обчислювати суму прямокутних областей на зображенні в будь-якому положенні чи масштабі, використовуючи лише чотири звернення:

sum=I(C)+I(A)I(B)I(D).

де точки A,B,C,D належать до інтегрального зображення I, як показано на рисунку.

Кожній гаароподібній ознаці може бути потрібно понад чотири звернення, залежно від того, як її було визначено. 2-прямокутниові ознаки Віоли та Джонса потребують шести звернень, для 3-прямокутникові — восьми звернень, а 4-прямокутникові — дев'яти.

Нахилені гаароподібні ознаки

Illustration of Haar-like features proposed by Lienhart: 4 edge features, 8 line features, and 2 center-surround features
Розширення, запропоноване Лієнгартом та Майдтом[4]

Лієнгарт і Майдт[4] запровадили поняття нахиленої (на 45°) гаароподібної ознаки. Його було використано для збільшення розмірності набору ознак у спробі покращити виявляння об'єктів на зображеннях. Це вдалося, оскільки деякі з цих ознак здатні описувати об'єкт краще. Наприклад, 2-прямокутникова нахилена гаарова ознака може вказувати на присутність контуру під кутом 45°.

Мессом і Барчак[5] розширили цю ідею до довільно повернутої гаароподібної ознаки. І хоча ця ідея математично обґрунтована, використанню гаароподібних ознак під довільним кутом перешкоджають практичні проблеми. Щоби бути швидкими, алгоритми виявлення використовують зображення з низькою роздільністю, що привносить похибки заокруглювання. Через це повернуті гаароподібні ознаки не набули широкого вжитку.

Примітки

Шаблон:Примітки

Література

  1. 1,0 1,1 Viola and Jones, "Rapid object detection using a boosted cascade of simple features", Computer Vision and Pattern Recognition, 2001 Шаблон:Ref-en
  2. Papageorgiou, Oren and Poggio, "A general framework for object detection", International Conference on Computer Vision, 1998. Шаблон:Ref-en
  3. Crow, F, "Summed-area tables for texture mapping Шаблон:Webarchive", in Proceedings of SIGGRAPH, 18(3):207–212, 1984 Шаблон:Ref-en
  4. 4,0 4,1 Lienhart, R. and Maydt, J., "An extended set of Haar-like features for rapid object detection Шаблон:Webarchive", ICIP02, pp. I: 900–903, 2002 Шаблон:Ref-en
  5. Messom, C.H. and Barczak, A.L.C., "Fast and Efficient Rotated Haar-like Features Using Rotated Integral Images", Australian Conference on Robotics and Automation (ACRA2006), pp. 1–6, 2006 Шаблон:Ref-en