Узагальнений структурний тензор
Шаблон:Виявляння ознак (комп'ютерний зір)
В Шаблон:Нп узага́льнений структу́рний те́нзор (УСТ, Шаблон:Lang-en) — розширення декартового структурного тензора до криволінійних координат.[1] Його переважно використовують для виявляння та подання параметрів «напрямку» кривих, так само як декартів структурний тензор виявляє та подає напрямок у декартових координатах. Найкраще досліджено сімейства кривих, породжених парами локально ортогональних функцій.
Це широко відомий метод у застосуваннях обробки зображень і відео, включно з комп'ютерним баченням, наприклад, у біометричній ідентифікація за відбитками пальців[2] та дослідженнях зрізів тканин людини.[3][4]
УСТ у двовимірних локально ортогональних базисах
Нехай термін «зображення» (Шаблон:Lang-en) подає функцію , де — дійсні змінні, а та — дійснозначні функції. УСТ подає напрямок, уздовж якого зображення може зазнавати нескінченно малого перенесення з мінімальною похибкою (Шаблон:Нп), уздовж «ліній», що відповідають таким умовам:
1. «Лінії» — це звичайні прямі в криволінійному координатному базисі
що є кривими в декартових координатах, як показано у рівнянні вище. Похибка вимірюється в сенсі , і її мінімальність відтак рахують відносно норми L2.
2. Функції становлять гармонічну пару, тобто задовольняють рівняння Коші — Рімана,
Відповідно, такі криволінійні координати локально ортогональні.
Тоді УСТ полягає в
де — похибки (нескінченно малого) паралельного перенесення у найкращому (позначеному кутом ) і найгіршому (визначаному через ) напрямках. Функція — це віконна функція, що визначає «зовнішній масштаб» (Шаблон:Lang-en), у якому виконуватиметься виявляння , яку можливо пропустити, якщо її вже включено до або якщо — повне зображення (а не локальне). Матриця — одинична матриця. Використовуючи ланцюгове правило, можливо показати, що наведене вище інтегрування можливо втілити як згортки в декартових координатах, застосовані до звичайного структурного тензора, коли утворюють пару дійсної та уявної частин аналітичної функції ,
де .[5] До прикладів аналітичних функцій належать , а також одночлени , , де — довільне додатне або від'ємне ціле число. Одночлени в комп'ютерному баченні та обробці зображень також називають гармонічними функціями.
Таким чином, декартів структурний тензор — це окремий випадок УСТ, в якому й , тобто, гармонічна функція — це просто . Таким чином, обравши гармонічну функцію , можливо виявляти всі криві, які є лінійними поєднаннями її дійсної та уявної частин, лише за допомогою згорток на (прямокутних) сітках зображень, навіть якщо недекартові. Крім того, обчислення згортки можливо виконувати за допомогою комплексних фільтрів, застосовуваних до комплексної версії структурного тензора. Таким чином, втілення УСТ часто виконують із використанням комплексної версії структурного тензора, а не тензора (1,1).
Комплексний варіант УСТ
Оскільки існує комплексна версія звичайного структурного тензора, існує також і комплексна версія УСТ
що ідентична своєму двоюрідному братові з тією різницею, що — комплексний фільтр. Слід нагадати, що звичайного структурного тензора — це дійсний фільтр, який зазвичай визначають дискретизованим та масштабованим гауссіаном для окреслення околу, відомого також як зовнішній масштаб. Ця простота є причиною того, чому втілення УСТ переважно використовували наведену вище комплексну версію. Для сімейств кривих , визначених аналітичними функціями , можливо показати,[1] що функція визначення околу є комплекснозначною,
- ,
так званою похідною симетрії гауссіана. Таким чином, напрямкову мінливість візерунку, яку потрібно шукати, безпосередньо включено до функції визначення околу, й виявляння відбувається в просторі (звичайного) структурного тензора.
Основна концепція його використання в обробці зображень і комп'ютерному баченні
Ефективне виявляння в зображеннях можливе шляхом обробки зображень для пари , . Основними обчислювальними елементами втілень УСТ є комплексні згортки (або відповідні матричні операції) та поточкові нелінійні відображення. Оцінку Шаблон:Нп відтак отримують разом із двома похибками, та . За аналогією з декартовим структурним тензором, оцінюваний кут має подвійнокутове подання, тобто обчислення надають , і його можливо використовувати як ознаку форми, тоді як окремо або в поєднанні з можливо використовувати як міру якості (впевненості, певності) для цієї оцінки кута.
Логарифмічні спіралі, включно з колами, можливо, наприклад, виявляти (комплексними) згортками та нелінійними відображеннями.[1] Спіралі можуть бути в зображеннях у відтінках сірого (багатозначних), або в бінарному зображенні, тобто розташування елементів контурів відповідних фігур, таких як контури кіл або спіралей, не повинно бути відомим чи якимось чином позначеним.
Узагальнений структурний тензор можливо використовувати як альтернативу перетворенню Гафа в обробці зображень і комп'ютерному баченні для виявляння образів, чиї локальні спрямування можливо моделювати, наприклад точок з'єднання. До основних відмінностей належать:
- Допускається від'ємне, а також комплексне голосування;
- За допомогою одного шаблону можливо виявляти декілька образів, які належать до одного сімейства;
- Бінаризація зображення не потрібна.
Фізична та математична інтерпретація
Криволінійні координати УСТ можуть інтерпретувати фізичні процеси, застосовувані до зображень. Добре відома пара процесів складається з обертання та масштабування. Вони пов'язані з перетворенням координат та .
Якщо зображення складається з ізокривих, які можливо інтерпретувати через лише , тобто його ізокриві складаються з кіл , де — будь-яка дійснозначна диференційовна функція, визначена на одному вимірі, то це зображення інваріантне до поворотів (навколо початку координат).
Операцію масштабування (включно зі зменшенням масштабу) моделюють подібно. Якщо зображення має ізокриві, схожі на «зірку» або велосипедні спиці, тобто, для деякої диференційовної одновимірної функції , то зображення інваріантне до масштабування (відносно початку координат).
У поєднанні,
інваріантна до певної величини обертання в поєднанні з масштабуванням, де цю величину уточнюють параметром .
Аналогічно, декартів структурний тензор — також подання паралельного перенесення. Тут фізичний процес полягає у звичайному паралельному перенесенні певної величини вздовж у поєднанні з паралельним перенесенням вздовж ,
де цю величину вказано параметром . Очевидно, тут позначує напрямок лінії.
Загалом, оцінений подає напрямок (в координатах ), уздовж якого нескінченно малі паралельні перенесення лишають зображення інваріантним, на практиці — найменшим варіантним. З кожною криволінійною координатною базисною парою існує пара нескінченно малих паралельних перенесень, лінійне поєднання яких є диференціальним оператором. Останні пов'язані з алгеброю Лі .
Різне
«Зображення» (Шаблон:Lang-en) у контексті УСТ може означати як звичайне зображення, так і якийсь його окіл (локальне зображення), залежно від контексту. Наприклад, фотографія — це зображення, як і будь-який окіл у ній.
Див. також
- Структурний тензор
- Перетворення Гафа
- Тензор
- Гауссове
- Виявляння кутів
- Виявляння контурів
- Афінне пристосовування форми
- Похідна за напрямком
- Диференціальний оператор
- Алгебра Лі