Масштабопросторові аксіоми

Простір масштабів
Масштабопросторові аксіоми
Втілення простору масштабів
Виявляння ознак
Виявляння контурів
Виявляння плям
Виявляння кутів
Виявляння хребтів
Виявляння особливих точок
Обирання масштабу
Афінне пристосовування форми
Масштабопросторове сегментування

В обробці зображень та комп'ютерному баченні для подання зображення як сімейства поступово згладжених зображень можуть використовувати систему простору масштабів. Ця система дуже загальна, й існує чимало різних подань просторів масштабів. Типовий підхід до вибору конкретного типу подання простору масштабів полягає у встановленні набору масштабопросторо́вих аксіо́м (англ. scale-space axioms), які описують основні властивості бажаного масштабопросторового подання, й які часто обирають так, щоби зробити це подання корисним у практичних застосуваннях. Щойно їх встановлено, ці аксіоми звужують можливі масштабопросторові подання до меншого класу, зазвичай лише з кількома вільними параметрами.

Набір стандартних аксіом простору масштабів, обговорених нижче, дає лінійний гауссів простір масштабів, що є найпоширенішим типом просторів масштабів, який використовують в обробці зображень та комп'ютерному баченні.

Аксіоми простору масштабів для лінійного масштабопросторового подання

Лінійне подання простору масштабів сигналу , отримуване згладжуванням гауссовим ядром , задовольняє низку властивостей «масштабопросторо́вих аксіо́м» (англ. 'scale-space axioms'), які роблять його особливою формою багатомасштабного подання:

лінійність
де та  — сигнали, тоді як та  — сталі,
інваріантність щодо зміщення
де позначує оператор зміщення (паралельного перенесення)
напівгрупова структура
з пов'язаною властивістю каскадного згладжування
існування нескінченно малого породжувача
нестворення локальних екстремумів (перетинів нуля) в одному вимірі,
непосилення локальних екстремумів у будь-якій кількості вимірів
на просторових максимумах, і на просторових мінімумах,
обертова симетрія
для деякої функції ,
масштабоінваріантність
для деяких функцій та , де позначує перетворення Фур'є ,
додатність
,
нормування
.

Насправді, можливо показати, що гауссове ядро є унікальним вибором за декількох різних комбінацій підмножин цих масштабопросторових аксіом:[1][2][3][4][5][6][7][8][9][10][11] більшість цих аксіом (лінійність, інваріантність щодо зміщення, напівгруповість) відповідають масштабуванню як напівгрупі інваріантного щодо зміщення лінійного оператора, якому задовольняє низка сімейств інтегральних перетворень, тоді як «нестворення локальних екстремумів»[4] для одновимірних сигналів та «непосилення локальних екстремумів»[4][7][10] для сигналів вищих вимірностей є вирішальними аксіомами, які пов'язують простори масштабів зі згладжуванням (формально, диференціальними рівняннями параболічного типу в частинних похідних), звідси й обрання гауссіана.

Гауссове ядро також є роздільним у декартових координатах, тобто, . Проте роздільність не рахується як масштабопросторова аксіома, оскільки це властивість, залежна від координат, пов'язана з нюансами втілення. Крім того, вимога роздільності в поєднанні з обертовою симетрією як така закріплює ядро згладжування як гауссове.

Існує узагальнення гауссової масштабопросторової теорії до загальніших афінних та просторово-часових просторів масштабів.[10][11] На додаток до мінливості за масштабом, для обробки якої було розроблено оригінальну масштабопросторову теорію, ця узагальнена масштабопросторова теорія (англ. generalized scale-space theory) містить також й інші типи мінливості, включно з деформаціями зображення, спричинюваними зміною точки огляду, наближуваними локальними афінними перетвореннями, та відносними рухами об'єктів світу та спостерігача, наближуваними локальними перетвореннями Галілея. У цій теорії обертова симетрія не є необхідною масштабопросторовою аксіомою, її натомість замінюють вимоги афінної та/або галілеєвої коваріантності. Узагальнена масштабопросторова теорія дає передбачення профілів рецептивних полів, які добре узгоджуються з профілями рецептивних полів, вимірюваними записуванням нейронів у біологічному зорі.[12][13][14]

У літературі з комп'ютерного бачення, обробки зображень та обробки сигналів існує багато інших багатомасштабних підходів із використанням вейвлетів та різноманітних інших ядер, які не використовують і не висувають таких же вимог, що й описи простору масштабів; див. статтю про пов'язані Багатомасштабні підходи. Була також робота над дискретними масштабопросторовими концепціями, які переносять масштабопросторові властивості в дискретну область; приклади та посилання див. у статті про втілення простору масштабів.

Див. також

Примітки

  1. Koenderink, Jan "The structure of images", Biological Cybernetics, 50:363–370, 1984 (англ.)
  2. J. Babaud, A. P. Witkin, M. Baudin, and R. O. Duda, Uniqueness of the Gaussian kernel for scale-space filtering. IEEE Trans. Pattern Anal. Machine Intell. 8(1), 26–33, 1986. (англ.)
  3. A. Yuille, T.A. Poggio: Scaling theorems for zero crossings. IEEE Trans. Pattern Analysis & Machine Intelligence, Vol. PAMI-8, no. 1, pp. 15–25, Jan. 1986. (англ.)
  4. а б в Lindeberg, T., "Scale-space for discrete signals," PAMI(12), No. 3, March 1990, pp. 234–254. [Архівовано 28 травня 2022 у Wayback Machine.] (англ.)
  5. Lindeberg, Tony, Scale-Space Theory in Computer Vision, Kluwer, 1994 [Архівовано 30 листопада 2020 у Wayback Machine.], (англ.)
  6. Pauwels, E., van Gool, L., Fiddelaers, P. and Moons, T.: An extended class of scale-invariant and recursive scale space filters, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, No. 7, pp. 691–701, 1995. (англ.)
  7. а б Lindeberg, T.: On the axiomatic foundations of linear scale-space: Combining semi-group structure with causality vs. scale invariance. In: J. Sporring et al. (eds.) Gaussian Scale-Space Theory: Proc. PhD School on Scale-Space Theory, (Copenhagen, Denmark, May 1996), pages 75–98, Kluwer Academic Publishers, 1997. (англ.)
  8. Florack, Luc, Image Structure, Kluwer Academic Publishers, 1997. (англ.)
  9. Weickert, J. Linear scale space has first been proposed in Japan. Journal of Mathematical Imaging and Vision, 10(3):237–252, 1999. (англ.)
  10. а б в Lindeberg, T. Generalized Gaussian scale-space axiomatics comprising linear scale-space, affine scale-space and spatio-temporal scale-space, Journal of Mathematical Imaging and Vision, Volume 40, Number 1, 36-81, 2011. [Архівовано 28 травня 2022 у Wayback Machine.] (англ.)
  11. а б Lindeberg, T. Generalized axiomatic scale-space theory, Advances in Imaging and Electron Physics, Elsevier, volume 178, pages 1-96, 2013. (англ.)
  12. Lindeberg, T. A computational theory of visual receptive fields, Biological Cybernetics, 107(6): 589-635, 2013. (англ.)
  13. Lindeberg, T. Invariance of visual operations at the level of receptive fields, PLoS ONE 8(7):e66990, 2013 (англ.)
  14. T. Lindeberg "Normative theory of visual receptive fields", Heliyon 7(1):e05897, 2021. (англ.)