Масштабопросторові аксіоми

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

Шаблон:Простір масштабів

В обробці зображень та комп'ютерному баченні для подання зображення як сімейства поступово згладжених зображень можуть використовувати систему простору масштабів. Ця система дуже загальна, й існує чимало різних подань просторів масштабів. Типовий підхід до вибору конкретного типу подання простору масштабів полягає у встановленні набору масштабопросторо́вих аксіо́м (Шаблон:Lang-en), які описують основні властивості бажаного масштабопросторового подання, й які часто обирають так, щоби зробити це подання корисним у практичних застосуваннях. Щойно їх встановлено, ці аксіоми звужують можливі масштабопросторові подання до меншого класу, зазвичай лише з кількома вільними параметрами.

Набір стандартних аксіом простору масштабів, обговорених нижче, дає лінійний гауссів простір масштабів, що є найпоширенішим типом просторів масштабів, який використовують в обробці зображень та комп'ютерному баченні.

Аксіоми простору масштабів для лінійного масштабопросторового подання

Лінійне подання простору масштабів L(x,y,t)=(Ttf)(x,y)=g(x,y,t)*f(x,y) сигналу f(x,y), отримуване згладжуванням гауссовим ядром g(x,y,t), задовольняє низку властивостей «масштабопросторо́вих аксіо́м» (Шаблон:Lang-en), які роблять його особливою формою багатомасштабного подання:

лінійність
Tt(af+bh)=aTtf+bTth
де f та h — сигнали, тоді як a та b — сталі,
інваріантність щодо зміщення
TtS(Δx,Δy)f=S(Δx,Δy)Ttf
де S(Δx,Δy) позначує оператор зміщення (паралельного перенесення) (S(Δx,Δy)f)(x,y)=f(xΔx,yΔy)
напівгрупова структура
g(x,y,t1)*g(x,y,t2)=g(x,y,t1+t2)
з пов'язаною властивістю каскадного згладжування
L(x,y,t2)=g(x,y,t2t1)*L(x,y,t1)
існування нескінченно малого породжувача A
tL(x,y,t)=(AL)(x,y,t)
нестворення локальних екстремумів (перетинів нуля) в одному вимірі,
непосилення локальних екстремумів у будь-якій кількості вимірів
tL(x,y,t)0 на просторових максимумах, і tL(x,y,t)0 на просторових мінімумах,
обертова симетрія
g(x,y,t)=h(x2+y2,t) для деякої функції h,
масштабоінваріантність
g^(ωx,ωy,t)=h^(ωxφ(t),ωxφ(t))
для деяких функцій φ та h^, де g^ позначує перетворення Фур'є g,
додатність
g(x,y,t)0,
нормування
x=y=g(x,y,t)dxdy=1.

Насправді, можливо показати, що гауссове ядро є унікальним вибором за декількох різних комбінацій підмножин цих масштабопросторових аксіом:[1][2][3][4][5][6][7][8][9][10][11] більшість цих аксіом (лінійність, інваріантність щодо зміщення, напівгруповість) відповідають масштабуванню як напівгрупі інваріантного щодо зміщення лінійного оператора, якому задовольняє низка сімейств інтегральних перетворень, тоді як «нестворення локальних екстремумів»[4] для одновимірних сигналів та «непосилення локальних екстремумів»[4][7][10] для сигналів вищих вимірностей є вирішальними аксіомами, які пов'язують простори масштабів зі згладжуванням (формально, диференціальними рівняннями параболічного типу в частинних похідних), звідси й обрання гауссіана.

Гауссове ядро також є роздільним у декартових координатах, тобто, g(x,y,t)=g(x,t)g(y,t). Проте роздільність не рахується як масштабопросторова аксіома, оскільки це властивість, залежна від координат, пов'язана з нюансами втілення. Крім того, вимога роздільності в поєднанні з обертовою симетрією як така закріплює ядро згладжування як гауссове.

Існує узагальнення гауссової масштабопросторової теорії до загальніших афінних та просторово-часових просторів масштабів.[10][11] На додаток до мінливості за масштабом, для обробки якої було розроблено оригінальну масштабопросторову теорію, ця узагальнена масштабопросторова теорія (Шаблон:Lang-en) містить також й інші типи мінливості, включно з деформаціями зображення, спричинюваними зміною точки огляду, наближуваними локальними афінними перетвореннями, та відносними рухами об'єктів світу та спостерігача, наближуваними локальними перетвореннями Галілея. У цій теорії обертова симетрія не є необхідною масштабопросторовою аксіомою, її натомість замінюють вимоги афінної та/або галілеєвої коваріантності. Узагальнена масштабопросторова теорія дає передбачення профілів рецептивних полів, які добре узгоджуються з профілями рецептивних полів, вимірюваними записуванням нейронів у біологічному зорі.[12][13][14]

У літературі з комп'ютерного бачення, обробки зображень та обробки сигналів існує багато інших багатомасштабних підходів із використанням вейвлетів та різноманітних інших ядер, які не використовують і не висувають таких же вимог, що й описи простору масштабів; див. статтю про пов'язані Багатомасштабні підходи. Була також робота над дискретними масштабопросторовими концепціями, які переносять масштабопросторові властивості в дискретну область; приклади та посилання див. у статті про втілення простору масштабів.

Див. також

Примітки

Шаблон:Примітки

  1. Koenderink, Jan "The structure of images", Biological Cybernetics, 50:363–370, 1984 Шаблон:Ref-en
  2. J. Babaud, A. P. Witkin, M. Baudin, and R. O. Duda, Uniqueness of the Gaussian kernel for scale-space filtering. IEEE Trans. Pattern Anal. Machine Intell. 8(1), 26–33, 1986. Шаблон:Ref-en
  3. A. Yuille, T.A. Poggio: Scaling theorems for zero crossings. IEEE Trans. Pattern Analysis & Machine Intelligence, Vol. PAMI-8, no. 1, pp. 15–25, Jan. 1986. Шаблон:Ref-en
  4. 4,0 4,1 4,2 Lindeberg, T., "Scale-space for discrete signals," PAMI(12), No. 3, March 1990, pp. 234–254. Шаблон:Webarchive Шаблон:Ref-en
  5. Lindeberg, Tony, Scale-Space Theory in Computer Vision, Kluwer, 1994 Шаблон:Webarchive, Шаблон:Ref-en
  6. Pauwels, E., van Gool, L., Fiddelaers, P. and Moons, T.: An extended class of scale-invariant and recursive scale space filters, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp. 691–701, 1995. Шаблон:Ref-en
  7. 7,0 7,1 Lindeberg, T.: On the axiomatic foundations of linear scale-space: Combining semi-group structure with causality vs. scale invariance. In: J. Sporring et al. (eds.) Gaussian Scale-Space Theory: Proc. PhD School on Scale-Space Theory, (Copenhagen, Denmark, May 1996), pages 75–98, Kluwer Academic Publishers, 1997. Шаблон:Ref-en
  8. Florack, Luc, Image Structure, Kluwer Academic Publishers, 1997. Шаблон:Ref-en
  9. Weickert, J. Linear scale space has first been proposed in Japan. Journal of Mathematical Imaging and Vision, 10(3):237–252, 1999. Шаблон:Ref-en
  10. 10,0 10,1 10,2 Lindeberg, T. Generalized Gaussian scale-space axiomatics comprising linear scale-space, affine scale-space and spatio-temporal scale-space, Journal of Mathematical Imaging and Vision, Volume 40, Number 1, 36-81, 2011. Шаблон:Webarchive Шаблон:Ref-en
  11. 11,0 11,1 Lindeberg, T. Generalized axiomatic scale-space theory, Advances in Imaging and Electron Physics, Elsevier, volume 178, pages 1-96, 2013. Шаблон:Ref-en
  12. Lindeberg, T. A computational theory of visual receptive fields, Biological Cybernetics, 107(6): 589-635, 2013. Шаблон:Ref-en
  13. Lindeberg, T. Invariance of visual operations at the level of receptive fields, PLoS ONE 8(7):e66990, 2013 Шаблон:Ref-en
  14. T. Lindeberg "Normative theory of visual receptive fields", Heliyon 7(1):e05897, 2021. Шаблон:Ref-en