Виявляння хребтів

Матеріал з testwiki
Версія від 09:49, 30 березня 2024, створена imported>InternetArchiveBot (Виправлено джерел: 0; позначено як недійсні: 1.) #IABot (v2.0.9.5)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Шаблон:Виявляння ознак (комп'ютерний зір) Шаблон:For Шаблон:Technical

В обробці зображень виявля́ння хребті́в (Шаблон:Lang-en) — це намагання за допомогою програмного забезпечення знаходити в зображенні хребти́ (Шаблон:Lang-en), визначені як криві, чиї точки є локальними максимумами функції, схожі на географічні хребти.

Для функції N змінних її хребти — це множина кривих, чиї точки є локальними максимумами в N − 1 вимірах. У цьому відношенні поняття точок хребта розширює поняття локального максимуму. Відповідно, поняття доли́н (Шаблон:Lang-en) для функції можна визначити, замінивши умову локального максимуму умовою локального мінімуму. Об'єднання множин хребтів і множин долин, разом із пов'язаною множиною точок, званою множино́ю сполу́чників (Шаблон:Lang-en), утворюють зв'язну множину кривих, які розбиваються, перетинаються або зустрічаються в критичних точках функції. Це спільне об'єднання множин називають відносною крити́чною множино́ю (Шаблон:Lang-en) функції.[1][2]

Множини хребтів, множини долин і відносні критичні множини подають важливу геометричну інформацію, притаманну функції. Певним чином вони забезпечують компактне подання важливих ознак функції, але питання про те, наскільки їх можливо використовувати, щоби визначати глобальні ознаки функції, залишається відкритим. Основна мотивація для створення процедур виявля́ння хребті́в і виявля́ння доли́н походить з Шаблон:Нп та комп'ютерного бачення, і полягає у вловлюванні внутрішностей видовжених об'єктів в області зображення. Пов'язані з хребтами подання в термінах Шаблон:Нп використовували для сегментування зображень. Були також спроби вловлювати форми об'єктів за допомогою графових подань, що відображують хребти, долини та критичні точки в області зображення. Проте такі уявлення можуть бути дуже чутливими до шуму, якщо обчислюються лише в одному масштабі. Оскільки обчислення теорії простору масштабів залучають згортку гауссовим (згладжувальним) ядром, сподівалися, що використання багатомасштабових хребтів, долин та критичних точок у контексті теорії простору масштабів дозволить забезпечувати надійніше подання об'єктів (або форм) у зображенні.

У цьому відношенні хребти та долини можливо розглядати як доповнення до природних особливих точок або точок локальних екстремумів. За належно визначених понять, хребти та долини в Шаблон:Нпні (або в якомусь іншому поданні, отриманому з ландшафту яскравості) можуть утворювати масштабоінваріантний кістяк для утворення просторових обмежень на локальний вигляд з низкою якісних подібностей до того, як серединноосьове перетворення Блюма забезпечує Шаблон:Нпні для бінарних зображень. У типових застосуваннях описувачі хребтів і долин часто використовують для виявляння доріг на аерофотознімках та для виявляння кровоносних судин на Шаблон:Нп чи тривимірних магнітно-резонансних зображеннях.

Диференціальногеометричне визначення хребтів і долин у фіксованому масштабі на двовимірному зображенні

Нехай f(x,y) позначує двовимірну функцію, і нехай L буде масштабопросторовим поданням f(x,y), отриманим згортанням f(x,y) гауссовою функцією

g(x,y,t)=12πte(x2+y2)/2t.

Крім того, нехай Lpp та Lqq позначують власні значення матриці Гессе

H=[LxxLxyLxyLyy]

масштабопросторового подання L з перетворенням координат (повертанням), застосованим до операторів локальних напрямних похідних,

p=sinβxcosβy,q=cosβx+sinβy

де p та q — координати повернутої системи координат.

Можливо показати, що змішана похідна Lpq у перетвореній системі координат нульова, якщо ми оберемо

cosβ=12(1+LxxLyy(LxxLyy)2+4Lxy2), sinβ=sgn(Lxy)12(1LxxLyy(LxxLyy)2+4Lxy2).

Тоді формальне диференціальногеометричне визначення хребтів f(x,y) у фіксованому масштабі t може бути виражено як набір точок, які задовольняють[3]

Lp=0,Lpp0,|Lpp||Lqq|.

Відповідно, долини f(x,y) в масштабі t — множина точок

Lq=0,Lqq0,|Lqq||Lpp|.

В системі координат (u,v) з напрямком v, паралельним градієнтові зображення,

u=sinαxcosαy,v=cosαx+sinαy

де

cosα=LxLx2+Ly2,sinα=LyLx2+Ly2

можливо показати, що це визначення хребтів і долин можливо натомість еквівалентно[4] записати як

Luv=0,Luu2Lvv20

де

Lv2Luu=Lx2Lyy2LxLyLxy+Ly2Lxx,
Lv2Luv=LxLy(LxxLyy)(Lx2Ly2)Lxy,
Lv2Lvv=Lx2Lxx+2LxLyLxy+Ly2Lyy

а знак Luu визначає полярність; Luu<0 для хребтів і Luu>0 для долин.

Розрахунок хребтів змінного масштабу з двовимірних зображень

Основна проблема поданого вище визначення хребта фіксованого масштабу полягає в тому, що воно може бути дуже чутливим до вибору рівня масштабу. Експерименти показують, що параметр масштабу гауссового ядра попереднього згладжування мусить бути ретельно підлаштовано до ширини хребтової структури в області зображення, щоби виявляч хребтів створював зв'язану криву, яка відображувала би структури в основі зображення. Для розв'язання цієї проблеми за відсутності попередньої інформації було введено поняття масштабопросторових хребтів (Шаблон:Lang-en), яке розглядає параметр масштабу як невід'ємну властивість визначення хребта й дозволяє рівням масштабу змінюватися вздовж масштабопросторового хребта. Більше того, концепція масштабопросторового хребта також дозволяє підлаштовувати параметр масштабу до ширини хребтових структур в області зображення автоматично, фактично як наслідок добре сформульованого визначення. У літературі на основі цієї ідеї було запропоновано низку різних підходів.

Нехай R(x,y,t) позначує міру вираженості хребта (яку буде вказано нижче). Тоді для двовимірного зображення масштабопросторовий гребінь — це множина точок, які задовольняють

Lp=0,Lpp0,t(R)=0,tt(R)0,

де t — параметр масштабу в масштабопросторовому поданні. Аналогічно, масштабопросторова долина (Шаблон:Lang-en) — це множина точок, які задовольняють

Lq=0,Lqq0,t(R)=0,tt(R)0.

Безпосереднім наслідком цього визначення є те, що для двовимірного зображення концепція масштабопросторових хребтів вимітає множину одновимірних кривих у тривимірному просторі масштабів, де параметрові масштабу дозволено змінюватися вздовж масштабопросторового хребта (чи масштабопросторової долини). Описувачем хребта в області зображення тоді буде проєкція цієї тривимірної кривої на двовимірну площину зображення, де інформацію про властивий масштаб у кожній точці хребта можливо використовувати як природну оцінку ширини хребтової структури в області зображення в околі цієї точки.

У літературі пропонують різні міри хребтової вираженості. Коли Ліндеберг (1996, 1998)[5] запровадив термін «масштабопросторовий хребет», він розглядав три міри хребтової вираженості:

  • Основна головна кривина
Lpp,γnorm=tγ2(Lxx+Lyy(LxxLyy)2+4Lxy2)
виражена в термінах γ-нормованих похідних через
ξ=tγ/2x,η=tγ/2y.
  • Квадрат різниці квадратів γ-нормованих власних значень
Nγnorm=(Lpp,γnorm2Lqq,γnorm2)2=t4γ(Lxx+Lyy)2((LxxLyy)2+4Lxy2).
  • Квадрат різниці γ-нормованих власних значень
Aγnorm=(Lpp,γnormLqq,γnorm)2=t2γ((LxxLyy)2+4Lxy2).

Поняття γ-нормованих похідних тут важливе, оскільки дозволяє алгоритмам виявляння хребтів і долин належно калібруватися. З вимоги, щоби для одновимірного гауссового хребта, вкладеного в два (або три) виміри, масштаб виявляння дорівнював ширині хребтової структури при вимірюванні в одиницях довжини (вимога відповідності між розмірами фільтра виявляння та структурою зображення, на яку він реагує), випливає, що слід обирати γ=3/4. З цих трьох мір вираженості хребта перша сутність Lpp,γnorm є мірою вираженості хребта загального призначення з багатьма застосуваннями, такими як виявляння кровоносних судин і виділяння доріг. Проте сутність Aγnorm використовували в таких застосуваннях як покращення відбитків пальців,[6] Шаблон:Нп та Шаблон:Нп у реальному часі,[7] а також для моделювання локальних статистик зображень для виявляння та відстежування людей у зображеннях та відео.[8]

Існують також й інші тісно пов'язані визначення хребта, які використовують нормовані похідні з неявним припущенням γ=1.[9] Проробити ці підходи докладніше. Проте при виявлянні хребтів з γ=1 масштаб виявляння буде вдвічі більшим, аніж для γ=3/4, що призводить до більших викривлень форми та нижчої здатності вловлювати хребти та долини з сусідніми завадними структурами зображення в його області.

Історія

Поняття хребтів і долин у цифрових зображеннях було запроваджено Шаблон:Нп 1983 року[10] та Кроулі стосовно пірамід різниць гауссіанів 1984 року.[11][12] Застосування хребтових описувачів до аналізу медичних зображень було детально досліджено Пайзером та його співробітниками,[13][14][15] давши їхнє поняття M-подань (Шаблон:Lang-en).[16] Ліндеберг також посприяв розвитку виявляння хребтів, запровадивши γ-нормовані похідні та масштабопросторові хребти, визначені з локальної максимізації належним чином нормованої головної кривини матриці Гессе (або інших мір вираженості хребта) над простором та над масштабом. Ці поняття пізніше було розвинуто із застосуванням до виділяння доріг Стегером та ін.[17][18] та до сегментування кровоносних судин за Франджі та ін.,[19] а також для виявлення криволінійних і трубчастих структур Сато та ін.[20] та Крисяном та ін.[21] Огляд кількох класичних визначень хребтів у фіксованому масштабі, включно з відношеннями між ними, було запропоновано Кендерінком та ван Дорном.[22] Огляд методів виділяння судин було запропоновано Кірбасом та Квеком.[23]

Визначення хребтів і долин у N вимірах

У своєму найширшому сенсі поняття хребта узагальнює уявлення про локальний максимум дійсної функції. Точка 𝐱0 в області визначення функції f:n є локальним максимумом цієї функції, якщо існує відстань δ>0, така, що якщо 𝐱 знаходиться всередині δ одиниць від 𝐱0, то f(𝐱)<f(𝐱0). Добре відомо, що критичні точки, для яких локальні максимуми є лише одним з їхніх типів, це ізольовані точки в області визначення функції у всіх ситуаціях, окрім найнезвичніших (тобто незагальних випадків).

Розгляньмо деяке послаблення умови f(𝐱)<f(𝐱0) для 𝐱 у всьому околі 𝐱0 до вимоги лише того, щоби вона дотримувалася в n1-вимірній підмножині. Імовірно, це послаблення дозволяє множині точок, що задовольняють цей критерій, які ми назвемо хребтом, мати один ступінь свободи, принаймні в загальному випадку. Це означає, що множина точок хребта утворюватиме одновимірне геометричне місце точок, або криву хребта (Шаблон:Lang-en). Зверніть увагу, що вищезазначене можливо видозмінити, узагальнивши це уявлення до локальних мінімумів й отримавши те, що можна було би назвати одновимірними кривими долин.

Наступне визначення хребта відповідає книзі Еберлі,[24] й його можливо розглядати як узагальнення деяких із вищезгаданих. Нехай Un — відкрита множина, а f:U гладенька. Нехай 𝐱0U. Нехай 𝐱0f — градієнт f в 𝐱0, і нехай H𝐱0(f) — матриця Гессе n×n функції f в 𝐱0. Нехай λ1λ2λn — це n впорядкованих власних значень H𝐱0(f), і нехай 𝐞i — одиничний власний вектор у власному просторі для λi. (Для цього слід виходити з відмінності всі власних значень.)

Точка 𝐱0 є точкою на 1-вимірному хребті f, якщо виконуються такі умови:

  1. λn1<0, і
  2. 𝐱0f𝐞i=0 для i=1,2,,n1.

Це уточнює поняття, що f, обмежена цим конкретним n1-вимірним підпростором, має локальний максимум в 𝐱0.

Це визначення природно узагальнюється на k -вимірний хребет наступним чином: точка 𝐱0 є точкою на k-вимірному хребті f, якщо виконуються наступні умови:

  1. λnk<0, і
  2. 𝐱0f𝐞i=0 для i=1,2,,nk.

Багато в чому ці визначення природно узагальнюють визначення локального максимуму функції. Властивості гребнів максимальної опуклості (Шаблон:Lang-en) покладено на тверду математичну основу Деймоном[1] та Міллером.[2] Їхні властивості в однопараметрових сімействах було визначено Келлером.[25]

Максимальномасштабовий хребет

Наступне визначення можливо простежити до Фріча,[26] який цікавився виділянням геометричної інформації про фігури у двовимірних зображеннях у відтінках сірого. Фріч обробляв своє зображення фільтром «серединності» (Шаблон:Lang-en), який давав йому інформацію, аналогічну даним «віддаленості від меж» (Шаблон:Lang-en) у просторі масштабів. Хребти цього зображення, проєктовані на первинне зображення, мали бути аналогічними кістякові форми (наприклад, блюмовій серединній осі) первинного зображення.

Далі наведено визначення максимальномасштабового хребта (Шаблон:Lang-en) функції трьох змінних, однією з яких є параметр «масштаб». Одне, чого ми хочемо дотриматися в цьому визначенні, це якщо (𝐱,σ) — точка на цьому хребті, то значення цієї функції в ній максимальне за виміром масштабу. Нехай f(𝐱,σ) — гладенька диференційована функція U2×+. (𝐱,σ) — точка на максимальномасштабовому хребті тоді й лише тоді, коли

  1. fσ=0 і 2fσ2<0, і
  2. f𝐞1=0 і 𝐞1tH(f)𝐞1<0.

Взаємозв'язок між виявлянням контурів та виявлянням хребтів

Метою виявляння хребтів зазвичай є вловлювання головної осі симетрії видовженого об'єкта,Шаблон:Джерело тоді як мета виявляння контурів зазвичай полягає у вловлюванні межі об'єкта. Проте деяка література з виявляння контурів помилковоШаблон:Джерело відносить поняття хребтів до поняття контурів, що заплутує ситуацію.

З точки зору визначень, між виявлячами контурів та виявлячами хребтів існує тісний зв'язок. З формулюванням не-максимуму, наведеним Кенні,[27] стверджується, що контури визначаються як точки, де величина градієнта набуває локального максимуму в напрямі градієнта. Дотримуючись диференціальногеометричного способу вираження цього визначення,[28] ми можемо у вищезгаданій системі координат (u,v) стверджувати, що величина градієнта масштабопросторового подання, яка дорівнює похідній за напрямом першого порядку в напрямі v, Lv, повинна мати свою напрямну похідну першого порядку в напрямі v рівною нулеві

v(Lv)=0

тоді як напрямна похідна другого порядку Lv в напрямі v має бути від'ємною, тобто

vv(Lv)0.

Записане як явний вираз у термінах локальних частинних похідних Lx, LyLyyy, це визначення контуру можливо виразити у вигляді кривих, які перетинають нуль, диференціального інваріанта

Lv2Lvv=Lx2Lxx+2LxLyLxy+Ly2Lyy=0,

що задовольняють знакові умові на наступному диференціальному інваріанті

Lv3Lvvv=Lx3Lxxx+3Lx2LyLxxy+3LxLy2Lxyy+Ly3Lyyy0

(додаткову інформацію див. у статті про виявляння контурів). Примітно, що отримані таким чином контури є хребтами величини градієнта.

Див. також

Примітки

Шаблон:Примітки

  1. 1,0 1,1 Шаблон:Cite journal Шаблон:Ref-en
  2. 2,0 2,1 Miller, J. Relative Critical Sets in n and Applications to Image Analysis. Ph.D. Dissertation. University of North Carolina. 1998. Шаблон:Ref-en
  3. Шаблон:Cite encyclopedia Шаблон:Ref-en
  4. Шаблон:Cite journal Шаблон:Ref-en
  5. Шаблон:Cite journal Ранішу версію подано на конференції IEEE з розпізнавання образів та комп'ютерного бачення, CVPR'96, Сан-Франциско, Каліфорнія, с. 465—470, червень 1996 Шаблон:Ref-en
  6. Шаблон:Cite journal Шаблон:Ref-en
  7. L. Bretzner, I. Laptev and T. Lindeberg: Hand Gesture Recognition using Multi-Scale Colour Features, Hierarchical Models and Particle Filtering, Proc. IEEE Conference on Face and Gesture 2002, Washington DC, 423–428. Шаблон:Webarchive Шаблон:Ref-en
  8. Шаблон:Cite journal Шаблон:Ref-en
  9. J. Furst and J. Miller, "The Maximal Scale Ridge: Incorporating Scale in the Ridge Definition Шаблон:Webarchive", Scale Space Theory in Computer Vision: Proceedings of the First International Conference on, Scale Space '97, pp. 93–104. Springer Lecture Notes in Computer Science, vol. 1682. Шаблон:Ref-en
  10. Шаблон:Cite journal Шаблон:Ref-en
  11. Шаблон:Cite journal Шаблон:Ref-en
  12. Шаблон:Cite journal Шаблон:Ref-en
  13. Шаблон:Cite journal Шаблон:Ref-en
  14. Шаблон:Cite journal Шаблон:Ref-en
  15. Шаблон:Cite journal Шаблон:Ref-en
  16. S. Pizer, S. Joshi, T. Fletcher, M. Styner, G. Tracton, J. Chen (2001) "Segmentation of Single-Figure Objects by Deformable M-reps", Proceedings of the 4th International Conference on Medical Image Computing and Computer-Assisted Intervention, Springer Lecture Notes In Computer Science; Vol. 2208, pp. 862–871 Шаблон:Webarchive Шаблон:Ref-en
  17. Шаблон:Cite journal Шаблон:Ref-en
  18. Шаблон:Cite journal Шаблон:Ref-en
  19. Шаблон:Cite journal Шаблон:Ref-en
  20. Шаблон:Cite journal Шаблон:Ref-en
  21. Шаблон:Cite journal Шаблон:Ref-en
  22. Шаблон:Cite journal Шаблон:Ref-en
  23. Шаблон:Cite journal Шаблон:Ref-en
  24. Шаблон:Cite book Шаблон:Ref-en
  25. Kerrel, R. Generic Transitions of Relative Critical Sets in Parameterized Families with Applications to Image Analysis. University of North Carolina. 1999. Шаблон:Ref-en
  26. Fritsch, DS, Eberly,D., Pizer, SM, and McAuliffe, MJ. "Stimulated cores and their applications in medical imaging." Information Processing in Medical Imaging, Y. Bizais, C Barillot, R DiPaola, eds., Kluwer Series in Computational Imaging and Vision, pp. 365–368. Шаблон:Ref-en
  27. Шаблон:Cite journal Шаблон:Ref-en
  28. Шаблон:Cite journal Шаблон:Ref-en