Простір масштабів

Матеріал з testwiki
Версія від 18:11, 1 лютого 2024, створена imported>Lxlalexlxl
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

Шаблон:Простір масштабів

Теорія про́стору масшта́бів (Шаблон:Lang-en) — це основа для багатомасштабного подання сигналів, розроблена спільнотами комп'ютерного бачення, обробки зображень та обробки сигналів з доповняльними мотивами з фізики та біологічного бачення. Це формальна теорія для роботи зі структурами зображень на різних Шаблон:Нп шляхом подавання зображення як однопараметрового сімейства згладжених зображень, масштабопросторо́вого подання́ (Шаблон:Lang-en), параметрованого розміром ядра Шаблон:Нп, яке використовують для пригнічування дрібномасштабних структур.[1][2][3][4][5][6][7][8] Параметр t у цьому сімействі називають параметром масштабу (Шаблон:Lang-en) з інтерпретацією, що у просторі масштабів структури зображення просторового розміру менше за приблизно t було значною мірою згладжено на масштабі t.

Основним типом простору масштабів є лінійний (гауссів) простір масштабів, який має широку застосовність, а також привабливу властивість можливості виведення з невеликого набору масштабопросторових аксіом. Відповідна масштабопросторова система охоплює теорію операторів гауссових похідних, які можливо використовувати як основу для вираження великого класу зорових операцій для комп'ютеризованих систем обробки зорової інформації. Ця система також дозволяє робити зорові операції масштабоінваріантними, що необхідно для роботи з варіаціями розміру, які можуть траплятися в даних зображень, оскільки реальні об'єкти можуть мати різні розміри, та й відстань між об'єктом і камерою може бути невідомою й може змінюватися залежно від обставин.[9][10]

Визначення

Поняття простору масштабів застосовують до сигналів довільної кількості змінних. Найпоширеніший випадок у літературі стосується двовимірних зображень, що й подано тут. Для заданого зображення f(x,y) його лінійне (гауссове) масштабопросторове подання — це сімейство похідних сигналів L(x,y;t), визначене згорткою f(x,y) таким двовимірним гауссовим ядром

g(x,y;t)=12πte(x2+y2)/2t,

що

L(,;t) =g(,;t)*f(,),

де крапка з комою в аргументі L означає, що згортка виконується лише над змінними x,y, тоді як параметр масштабу t після крапки з комою просто вказує, який рівень масштабу визначають. Це визначення L працює для континууму масштабів t0, але зазвичай розглядають лише скінченний дискретний набір рівнів у масштабопросторовому поданні.

Параметр масштабу t=σ2 — це дисперсія гауссового фільтра, і в граничному випадку для t=0 фільтр g стає імпульсною функцією, так що L(x,y;0)=f(x,y), тобто масштабопросторове подання на рівні масштабу t=0 це саме зображення f. Зі збільшенням t, L стає результатом згладжування f все більшим і більшим фільтром, таким чином видаляючи все більше деталей, які містить зображення. Оскільки стандартним відхиленням фільтра є σ=t, значно менші за це значення деталі значною мірою видаляються із зображення за параметра масштабу t, див. графічні ілюстрації в наступному рисунку та в [11].

Чому саме гауссів фільтр?

При стиканні із завданням створення багатомасштабного подання можна запитати: чи можливо використовувати для створення простору масштабів будь-який фільтр g на кшталт фільтру низьких частот із параметром t, який визначає його ширину? Відповідь — ні, оскільки дуже важливо, щоби згладжувальний фільтр не вносив нових паразитних структур на грубих масштабах, які не відповідають спрощенням відповідних структур у тонших масштабах. У літературі з простору масштабів було висловлено низку різних способів сформулювати цей критерій точними математичними термінами.

Висновок з кількох різних поданих аксіоматичних виведень полягає в тому, що гауссів простір масштабів становить канонічний спосіб породження лінійного простору масштабів, заснований на істотній вимозі, що при переході від тонкого до будь-якого грубішого масштабу не повинні створюватися нові структури.[1][3][4][6][9][12][13][14][15][16][17][18][19] До умов, званих масштабопросторовими аксіомами, які використовували для виведення унікальності гауссового ядра, належать Шаблон:Нп, Шаблон:Нп, напівгрупова структура, непосилення локальних екстремумів, масштабова та Шаблон:Нп. У працях [15][20][21] цю унікальність, заявлену в аргументах на основі інваріантності щодо масштабу, піддають критиці, й пропонують альтернативні самоподібні масштабопросторові ядра. Гауссове ядро, проте, є унікальним вибором відповідно до масштабопросторової аксіоматики на основі причинності[3] або непосилення локальних екстремумів.[16][18]

Альтернативне визначення

Еквівалентно, масштабопросторове сімейство можливо визначити як розв'язок рівняння дифузії (наприклад, у термінах рівняння теплопровідності),

tL=122L,

з початковою умовою L(x,y;0)=f(x,y). Це формулювання масштабопросторового подання L означає, що можливо інтерпретувати значення яскравості зображення f як «розподіл температури» в площині зображення, і що процес, який породжує масштабопросторове подання як функцію від t, відповідає дифузії тепла в площині зображення за час t (за припущення, що теплопровідність матеріалу дорівнює довільно обраній сталій ½). Хоча цей зв'язок може здатися поверховим читачеві, не знайомому з диференціальними рівняннями, насправді дійсно основне масштабопросторове формулювання в термінах непосилення локальних екстремумів виражається через умову знаку на частинні похідні в 2+1-вимірному об'ємі, породженому простором масштабів, відтак у рамках диференціальних рівнянь з частинними похідними. Крім того, детальний аналіз дискретного випадку показує, що рівняння дифузії забезпечує об'єднувальний зв'язок між безперервним і дискретним просторами масштабів, що також узагальнюється на нелінійні простори масштабів, наприклад, із застосуванням анізотропної дифузії. Отже, можна сказати, що основним способом породження простору масштабів є рівняння дифузії, і що гауссове ядро виникає як функція Гріна цього конкретного диференціального рівняння в частинних похідних.

Мотивації

Мотивація для породження масштабопросторового подання заданого набору даних походить від базового спостереження, що об'єкти реального світу складаються з різних структур на різних Шаблон:Нп. Це означає, що об'єкти реального світу, на противагу до ідеалізованих математичних об'єктів, таких як точки або прямі, можуть виглядати по-різному залежно від масштабу спостереження. Наприклад, поняття «дерево» доречне в масштабі метрів, тоді як такі поняття, як листя та молекули, доречніші в тонших масштабах. Для системи комп'ютерного бачення, яка аналізує невідому сцену, немає способу знати апріорі, які Шаблон:Нп підходять для опису цікавих структур у даних зображення. Отже, єдиним розумним підходом є розглядати описи в кількох масштабах, щоб мати можливість вловлювати невідомі варіації масштабу, які можуть мати місце. У граничному випадку масштабопросторове подання розглядає подання на всіх масштабах.[9]

Інша мотивація концепції простору масштабів походить від процесу виконання фізичних вимірювань на реальних даних. Щоби виділяти будь-яку інформацію з процесу вимірювання, до даних необхідно застосовувати оператори нескінченно малого розміру. В багатьох галузях інформатики та прикладної математики розмір оператора вимірювання при теоретичному моделюванні задачі не враховується. З іншого боку, масштабопросторова теорія явним чином включає потребу в не нескінченно малому розмірі операторів зображення як невід'ємній частини будь-якого вимірювання, а також будь-якої іншої операції, яка залежить від вимірювання в реальному світі.[5]

Існує тісний зв'язок між масштабопросторовою теорією та біологічним баченням. Багато масштабопросторових операцій демонструють високий ступінь подібності з профілями рецептивних полів, записаними на сітківці й перших етапах зорової кори ссавців. У цьому відношенні систему простору масштабів можливо розглядати як теоретично обґрунтовану парадигму для попередньої обробки зорової інформації, яку до того ж було ретельно перевірено алгоритмами та експериментами.[4][9]

Гауссові похідні

На будь-якому масштабі в просторі масштабів ми можемо застосовувати до масштабопросторового подання оператори локальних похідних:

Lxmyn(x,y;t)=(xmynL)(x,y;t).

Через комутативну властивість між оператором похідної та оператором гауссового згладжування такі масштабопросторові похідні (Шаблон:Lang-en) можливо еквівалентно обчислювати шляхом згортання первинного зображення з операторами похідних гауссіанів. З цієї причини їх часто також називають гауссовими похідними (Шаблон:Lang-en):

Lxmyn(,;t)=xmyng(,;t)*f(,).

Унікальність операторів гауссових похідних як локальних операцій, виведених із масштабопросторового подання, можливо отримати аналогічними аксіоматичними виведеннями, які використовують для виведення унікальності гауссового ядра для масштабопросторового згладжування.[4][22]

Зорова попередня обробка

Ці оператори гауссових похідних, своєю чергою, можливо об'єднувати за допомогою лінійних або нелінійних операторів у великий спектр різних типів виявлячів ознак, які в багатьох випадках можливо добре моделювати за допомогою диференціальної геометрії. Зокрема, інваріантність (або, точніше, коваріантність) до локальних геометричних перетворень, таких як обертання або локальні афінні перетворення, можливо отримати шляхом розгляду диференціальних інваріантів за відповідного класу перетворень або, як варіант, шляхом унормовування операторів гауссових похідних на локально визначену систему координат, визначену, наприклад, з бажаного спрямування в області зображення, або шляхом застосування бажаного локального афінного перетворення до локального фрагмента зображення (докладніше див. у статті про афінне пристосовування форми).

Коли оператори гауссових похідних та диференціальні інваріанти використовують таким чином як виявлячі базових ознак у кількох масштабах, ці незавершені перші етапи зорової обробки часто називають зоровою попередньою обробкою (Шаблон:Lang-en). Цю загальну систему застосовували до широкого спектру задач комп'ютерного бачення, включно з виявлянням та класифікуванням ознак, сегментуванням та зіставлянням зображень, оцінюванням руху, обчисленням сигналів про форму, та Шаблон:Нп. Набір операторів гауссових похідних до певного порядку часто називають N-струменем, він становить базовий тип ознак масштабопросторової системи.

Приклади виявлячів

Дотримуючись ідеї вираження зорових операцій у термінах диференціальних інваріантів, обчислюваних на кількох масштабах із застосуванням операторів гауссових похідних, ми можемо виразити виявляч контурів із набору точок, який задовольняє вимогу, щоби величина градієнта

Lv=Lx2+Ly2

набувала локального максимуму в напрямку градієнта

L=(Lx,Ly)T.

Шляхом диференціальногеометричних розробок можливо показати,[4] що цей диференціальний виявляч контурів можливо еквівалентно виразити з перетинів нуля диференціальним інваріантом другого порядку

L~v2=Lx2Lxx+2LxLyLxy+Ly2Lyy=0

які задовольняють таку умові знаку на диференціальному інваріанті третього порядку:

L~v3=Lx3Lxxx+3Lx2LyLxxy+3LxLy2Lxyy+Ly3Lyyy<0.

Аналогічно, багатомасштабні виявлячі плям на будь-якому заданому фіксованому масштабі[23][9] можливо отримати з локальних максимумів та мінімумів або оператора Лапласа (що також називають лапласіаном гауссіана)

2L=Lxx+Lyy

або визначника матриці Гессе

detHL(x,y;t)=(LxxLyyLxy2).

Аналогічним чином виявлячі кутів та виявлячі хребтів і долин можливо виразити як локальні максимуми, мінімуми або перетини нуля багатомасштабних диференціальних інваріантів, визначених із гауссових похідних. Алгебричні вирази для операторів виявляння кутів і хребтів, проте, є дещо складнішими, й читача відсилають по додаткові відомості до статей про виявляння кутів і хребтів.

Масштабопросторові операції також часто використовують для вираження грубо—точних методів (Шаблон:Lang-en), зокрема для таких завдань, як зіставляння та багатомасштабне сегментування зображень.

Обирання масштабу

Подана на даний момент теорія описує добре обґрунтовану систему для подавання структур зображень у кількох масштабах. Проте в багатьох випадках також необхідно обирати локально доречні масштаби для подальшого аналізу. Така потреба в обиранні масштабу (Шаблон:Lang-en) постає з двох основних причин: (i) об'єкти реального світу можуть мати різний розмір, і цей розмір може бути невідомим системі бачення, та (ii) відстань між об'єктом та камерою може змінюватися, й ця інформація про відстань також може бути невідомою апріорно. Дуже корисною властивістю масштабопросторового подання є те, що подання зображень можливо робити інваріантними до масштабів шляхом автоматичного обирання локального масштабу[9][10][23][24][25][26][27][28] на основі локальних максимумів (або мінімумів) над масштабами масштабонормованих похідних

Lξmηn(x,y;t)=t(m+n)γ/2Lxmyn(x,y;t)

де γ[0,1] — параметр, пов'язаний з розмірністю ознаки зображення. Цей алгебричний вираз для операторів масштабонормованих гауссових похідних походить із введення γ-нормованих похідних відповідно до

ξ=tγ/2x і η=tγ/2y.

Може бути теоретично показано, що модуль обирання масштабу, який працює за цим принципом, задовольнятиме такій властивості коваріантності щодо масштабу (Шаблон:Lang-en): якщо для певного типу ознаки зображення передбачається локальний максимум у певному зображенні на певному масштабі t0, то за масштабування зображення коефіцієнтом масштабу s цей локальний максимум над масштабами у зміненому зображенні зміниться до рівня масштабу s2t0.[23]

Масштабоінваріантне виявляння ознак

Шаблон:Див. також Дотримуючись цього підходу гамма-нормованих похідних, можливо показати, що можливо виразити різні типи масштабопристосованих та масштабоінваріантних виявлячів ознак[9][10][23][24][25][29][30][27] для таких завдань як виявляння плям, кутів, хребтів, контурів та просторово-часових особливих точок (докладний опис формулювання цих масштабоінваріантних виявлячів ознак див. у конкретних статтях на ці теми). Крім того, рівні масштабу, отримувані автоматичним обиранням, можливо використовувати, щоби визначати особливі області для подальшого Афінне пристосовування форми[31] для отримання афінноінваріантних особливих точок,[32][33] або для визначення рівнів масштабу для обчислення пов'язаних Шаблон:Нп, таких як локально масштабопристосовані N-струмені.

Нещодавні праці показали, що таким чином можливо виконувати й складніші операції на кшталт масштабонезалежного Шаблон:Нп, обчислюючи локальні описувачі зображення (N-струмені чи локальні гістограми спрямування градієнтів) у масштабопристосованих особливих точках, отриманих із масштабопросторових екстремумів нормованого оператора Лапласа (див. також масштабоінваріантне ознакове перетворення[34]) або визначника матриці Гессе (див. також прискорені стійкі ознаки);[35] див. також статтю Scholarpedia про масштабоінваріантне ознакове перетворення[36] про загальніший погляд на підходи до розпізнавання об'єктів на основі відгуків рецептивних полів[19][37][38][39] у термінах операторів гауссових похідних або їхніх наближень.

Пов'язані багатомасштабні подання

Піраміда зображення — це дискретне подання, в якому простір масштабів дискретизують як у просторі, так і в масштабі. Для масштабоінваріантності коефіцієнти масштабу слід вибирати експоненційно, наприклад, як цілі степені 2 або Шаблон:Math. За правильної побудови, відношення частот дискретизації у просторі та масштабі залишають сталим, тоді імпульсний відгук ідентичний на всіх рівнях піраміди.[40][41][42][43] Існують швидкі, Ο(N), алгоритми для обчислювання масштабоінваріантної піраміди зображення, в якій зображення або сигнал багаторазово згладжується, і відтак субдискретизується. Значення для простору масштабів між зразками в піраміді можливо легко оцінювати, застосовуючи інтерполяцію в межах масштабів і між ними, й уможливлюючи оцінки масштабу та положення з екстрароздільністю.[43]

У масштабопросторовому поданні існування безперервного параметра масштабу дозволяє відстежувати перетини нуля над масштабами, що дає так звану глибоку структуру (Шаблон:Lang-en). Для ознак, визначених як Шаблон:Нп диференціальними інваріантами, теорема про неявну функцію безпосередньо визначає траєкторії крізь масштаби,[4][44] і на тих масштабах, де відбуваються розгалуження, локальну поведінку можливо моделювати за допомогою Шаблон:Нп.[4][44][45][46][47]

Розширення теорії лінійного простору масштабів стосуються формулювання нелінійних масштабопросторових концепцій, краще пристосованих до конкретних цілей.[48][49] Ці Шаблон:Нпні (Шаблон:Lang-en) часто починаються з еквівалентного дифузійного формулювання концепції простору масштабів, яке згодом розширюють нелінійним чином. Таким чином було сформульовано велику кількість еволюційних рівнянь, умотивованих різними специфічними вимогами (додаткову інформацію див. у вищезгаданій літературі). Проте слід зазначити, що не всі ці нелінійні простори масштабів задовольняють подібним «приємним» теоретичним вимогам, як і концепція лінійного гауссового простору масштабів. Тож іноді можуть виникати несподівані артефакти, і слід бути дуже обережними, щоби не використовувати термін «масштабопросторове» для взагалі будь-якого типу однопараметрових сімейств зображень.

Розширення першого порядку ізотропного гауссового простору масштабів забезпечує афінний (гауссів) простір масштабів.[4] Один із мотивів цього розширення витікає із загальної потреби в обчисленні описувачів зображень для об'єктів реального світу, які розглядають за Шаблон:Нпні. Щоб обробляти такі нелінійні деформації локально, часткової інваріантності (або, правильніше, Шаблон:Нп) до локальних Шаблон:Нп може бути досягнуто шляхом розгляду афінних гауссових ядер, форми яких визначаються локальною структурою зображення;[31] теорію та алгоритми див. у статті про афінне пристосовування форми. Справді, цей афінний простір масштабів також можливо виразити з неізотропного розширення лінійного (ізотропного) рівняння дифузії, все ще перебуваючи в класі лінійних диференціальних рівнянь з частинними похідними.

Існує загальніше розширення гауссової масштабопросторової моделі на афінні та просторово-часові простори масштабів.[4][31][18][19][50] На додачу до змінюваності над масштабами, для обробки яких було розроблено первинну масштабопросторову теорію, ця узагальнена масштабопросторова теорія (Шаблон:Lang-en)[19] охоплює також й інші типи змінюваності, викликанні геометричними перетвореннями в процесі формування зображення, включно зі змінюваністю в напрямку огляду, наближуваною локальними афінними перетвореннями, та відносним рухом об'єктів світу та спостерігача, наближуваним локальними перетвореннями Галілея. Ця узагальнена масштабопросторова теорія веде до передбачень щодо профілів рецептивних полів, які мають добре якісне узгодження з профілями рецептивних полів, вимірюваними за допомогою записів нейронів у біологічному зорі.[51][52][50][53]

Існують тісні взаємозв'язки між масштабопросторовою та вейвлетною теоріями, хоч ці два поняття багатомасштабного подання й було розроблено з дещо різних посилок. Була також робота й над іншими багатомасштабними підходами, такими як піраміди та різноманітні інші ядра, які не використовують або не вимагають тих же вимог, що й справжні масштабопросторові описи.

Відношення до біологічного зору та слуху

Існують цікаві зв'язки між масштабопросторовим поданням та біологічним зором і слухом. Нейрофізіологічні дослідження біологічного зору показали, що існують профілі рецептивних полів у сітківці й зоровій корі ссавців, які можливо добре моделювати лінійними операторами гауссових похідних, у деяких випадках також доповненими неізотропною афінною масштабопросторовою моделлю, просторово-часовою масштабопросторовою моделлю, та/або нелінійними комбінаціями таких лінійних операторів.[18][51][52][50][53][54][55][56][57]

Стосовно біологічного слуху, існують профілі рецептивних полів у Шаблон:Нп та Шаблон:Нп, які можливо добре моделювати спектрально-часовими рецептивними полями, які можливо добре моделювати гауссовими похідними над логарифмічними частотами та віконними перетвореннями Фур'є над часом, де віконні функції є часовими масштабопросторовими ядрами.[58][59]

Глибоке навчання та простір масштабів

У сфері класичного комп'ютерного зору масштабопросторова теорія зарекомендувала себе як теоретична основа для попередньої зорової обробки, при цьому гауссові похідні становлять канонічну модель для першого шару рецептивних полів. З появою глибокого навчання також розпочалася робота над використанням гауссових похідних або гауссових ядер як загальної основи для рецептивних полів у глибоких мережах.[60][61][62][63][64] Використовуючи перетворювальні властивості гауссових похідних та гауссових ядер при масштабувальних перетвореннях, можливо отримати масштабову коваріантність/еквіваріантність та масштабоінваріантність глибокої мережі для обробки структур зображення в різних масштабах теоретично обґрунтованим чином.[62][63] Також було розроблено підходи для отримання масштабової коваріантності/еквіваріантності та масштабоінваріантності за допомогою навчених фільтрів у поєднанні з декількома масштабовими каналами.[65][66][67][68][69] Зокрема, використовуючи поняття масштабової коваріантності/еквіваріантності та масштабоінваріантності, можливо забезпечувати надійне функціювання глибоких мереж на масштабах, не охоплених тренувальними даними, таким чином забезпечуючи масштабове узагальнювання.[62][63][67][69]

Нюанси втілювання

При втілюванні масштабопросторового згладжування на практиці існує низка різних підходів, які можливо застосовувати в термінах безперервного або дискретного гауссового згладжування, втілення в області Фур'є, в термінах пірамід на основі біноміальних фільтрів, що наближують гауссів, або з використанням рекурсивних фільтрів. Докладніше це висвітлено в окремій статті про Втілення простору масштабів.

Див. також

Примітки

Шаблон:Reflist

Література

Посилання

  1. 1,0 1,1 Ijima, T. "Basic theory on normalization of pattern (in case of typical one-dimensional pattern)". Bull. Electrotech. Lab. 26, 368– 388, 1962. Шаблон:Ref-ja
  2. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою wit83 не вказано текст
  3. 3,0 3,1 3,2 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою koe84 не вказано текст
  4. 4,0 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою lin94 не вказано текст
  5. 5,0 5,1 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою lin94review не вказано текст
  6. 6,0 6,1 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою flo97 не вказано текст
  7. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою sporring-etal-1997 не вказано текст
  8. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою rom03 не вказано текст
  9. 9,0 9,1 9,2 9,3 9,4 9,5 9,6 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою lin08 не вказано текст
  10. 10,0 10,1 10,2 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою lin14compvisrefguide не вказано текст
  11. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою lin-cern не вказано текст
  12. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Babaud-EtAl не вказано текст
  13. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Yuille-Poggio не вказано текст
  14. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Lindeberg-1990 не вказано текст
  15. 15,0 15,1 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Pauwels-EtAl не вказано текст
  16. 16,0 16,1 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Lindeberg-1997 не вказано текст
  17. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Weickert-1999 не вказано текст
  18. 18,0 18,1 18,2 18,3 Lindeberg, T. Generalized Gaussian scale-space axiomatics comprising linear scale-space, affine scale-space and spatio-temporal scale-space, Journal of Mathematical Imaging and Vision, 40(1): 36–81, 2011. Шаблон:Ref-en
  19. 19,0 19,1 19,2 19,3 Lindeberg, T. Generalized axiomatic scale-space theory, Advances in Imaging and Electron Physics, Elsevier, volume 178, pages 1–96, 2013. Шаблон:Ref-en
  20. M. Felsberg and G.Sommer "The Monogenic Scale-Space: A Unifying Approach to Phase-Based Image Processing in Scale Space", Journal of Mathematical Imaging and Vision, 21(1): 5–28, 2004. Шаблон:Ref-en
  21. R. Duits, L. Florack, J. de Graaf and B. ter Haar Romeny "On the Axioms of Scale Space Theory", Journal of Mathematical Imaging and Vision, 20(3): 267–298, 2004. Шаблон:Ref-en
  22. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Koenderink-vanDoorn не вказано текст
  23. 23,0 23,1 23,2 23,3 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою lin98 не вказано текст
  24. 24,0 24,1 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою lin98b не вказано текст
  25. 25,0 25,1 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою lin99cvhandbook не вказано текст
  26. T. Lindeberg "Temporal scale selection in time-causal scale space", Journal of Mathematical Imaging and Vision, 58(1): 57–101, 2017. Шаблон:Ref-en
  27. 27,0 27,1 T. Lindeberg "Spatio-temporal scale selection in video data", Journal of Mathematical Imaging and Vision, 60(4): 525–562, 2018. Шаблон:Ref-en
  28. T. Lindeberg "Dense scale selection over space, time and space-time", SIAM Journal on Imaging Sciences, 11(1): 407–441, 2018. Шаблон:Ref-en
  29. T. Lindeberg ``Scale selection properties of generalized scale-space interest point detectors", Journal of Mathematical Imaging and Vision, 46(2): 177–210, 2013. Шаблон:Ref-en
  30. T. Lindeberg ``Image matching using generalized scale-space interest points", Journal of Mathematical Imaging and Vision, 52(1): 3–36, 2015. Шаблон:Ref-en
  31. 31,0 31,1 31,2 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою lingar97 не вказано текст
  32. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Baumberg-2000 не вказано текст
  33. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Mikolajczyk-Schmid не вказано текст
  34. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Lowe-2004 не вказано текст
  35. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Bay-EtAl не вказано текст
  36. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Lindeberg-Scholarpedia не вказано текст
  37. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Schiele-Crowley не вказано текст
  38. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Linde-Lindeberg-2004 не вказано текст
  39. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Linde-Lindeberg-2012 не вказано текст
  40. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Burt-Adelson не вказано текст
  41. Crowley, J. L. and Stern, R. M. (1984) Fast Computation of the Difference of Low Pass Transform, IEEE Transactions on Pattern Analysis and Machine Intelligence 6:212-222 Шаблон:Ref-en
  42. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Crowley-Sanderson не вказано текст
  43. 43,0 43,1 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Lindeberg-Bretzner не вказано текст
  44. 44,0 44,1 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою lin92jmiv не вказано текст
  45. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Koendering-vanDoorn-1986 не вказано текст
  46. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Damon-1995 не вказано текст
  47. Florack, L., Kuijper, A. The topological structure of scale-space images. Journal of Mathematical Imaging and Vision 12, 65–79, 2000. Шаблон:Ref-en
  48. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Romeny-1994 не вказано текст
  49. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Weickert-1998 не вказано текст
  50. 50,0 50,1 50,2 T. Lindeberg (2016) "Time-causal and time-recursive spatio-temporal receptive fields", Journal of Mathematical Imaging and Vision, 55(1): 50–88. Шаблон:Ref-en
  51. 51,0 51,1 Lindeberg, T. A computational theory of visual receptive fields, Biological Cybernetics, 107(6): 589–635, 2013. Шаблон:Ref-en
  52. 52,0 52,1 Lindeberg, T. Invariance of visual operations at the level of receptive fields, PLoS ONE 8(7):e66990, 2013 Шаблон:Ref-en
  53. 53,0 53,1 Lindeberg, T. (2021) Normative theory of visual receptive fields, Heliyon 7(1): e05897 Шаблон:Ref-en
  54. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою DeAngelis-EtAl не вказано текст
  55. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Young-1987 не вказано текст
  56. Young R.A., Lesperance R.M., Meyer W.W. (2001) The Gaussian derivative model for spatio-temporal vision: I. Cortical model. Spat. Vis. 14: 261-319 Шаблон:Ref-en
  57. Young R.A. Lesperance R.M. (2001) The Gaussian derivative model for spatio-temporal vision: II. Cortical data. Spat. Vis. 14: 321-389 Шаблон:Ref-en
  58. T. Lindeberg and A. Friberg "Idealized computational models of auditory receptive fields", PLOS ONE, 10(3): e0119032, pages 1–58, 2015 Шаблон:Ref-en
  59. T. Lindeberg and A. Friberg (2015) ``Scale-space theory for auditory signals", Proc. SSVM 2015: Scale-Space and Variational Methods in Computer Vision, Springer LNCS 9087: 3–15. Шаблон:Ref-en
  60. Jacobsen, J.J., van Gemert, J., Lou, Z., Smeulders, A.W.M. (2016) Structured receptive fields in CNNs. In: Proceedings of Computer Vision and Pattern Recognition, pp. 2610–2619. Шаблон:Ref-en
  61. Worrall, D., Welling, M. (2019) Deep scale-spaces: Equivariance over scale. In: Advances in Neural Information Processing Systems (NeurIPS 2019), pp. 7366–7378. Шаблон:Ref-en
  62. 62,0 62,1 62,2 Lindeberg, T. (2020) Provably scale-covariant continuous hierarchical networks based on scale-normalized differential expressions coupled in cascade. J. Math. Imaging Vis. 62, 120–148. Шаблон:Ref-en
  63. 63,0 63,1 63,2 Lindeberg, T. (2022) Scale-covariant and scale-invariant Gaussian derivative networks. J. Math. Imaging Vis. 64, 223–242. Шаблон:Ref-en
  64. Pintea, S. L., Tömen, N., Goes, S. F., Loog, M., & van Gemert, J. C. (2021). Resolution learning in deep convolutional networks using scale-space theory. IEEE Transactions on Image Processing, 30, 8342-8353. Шаблон:Ref-en
  65. Sosnovik, I., Szmaja, M., Smeulders, A. (2020) Scale-equivariant steerable networks. In: International Conference on Learning Representations. Шаблон:Ref-en
  66. Bekkers, E.J.: B-spline CNNs on Lie groups (2020) In: International Conference on Learning Representations. Шаблон:Ref-en
  67. 67,0 67,1 Jansson, Y., Lindeberg, T. (2021) Exploring the ability of CNNs to generalise to previously unseen scales over wide scale ranges. In: International Conference on Pattern Recognition (ICPR 2020), pp. 1181–1188. Шаблон:Ref-en
  68. Sosnovik, I., Moskalev, A., Smeulders, A. (2021) DISCO: Accurate discrete scale convolutions. In: British Machine Vision Conference. Шаблон:Ref-en
  69. 69,0 69,1 Jansson, Y., Lindeberg, T. (2022) Scale-invariant scale-channel networks: Deep networks that generalise to previously unseen scales, Journal of Mathematical Imaging and Vision, dot:10.1007/s10851-022-01082-2. Шаблон:Ref-en