Анізотропна дифузія

Матеріал з testwiki
Версія від 18:00, 14 лютого 2023, створена imported>Ата (примітки і формули з вихідної статті енвікі)
(різн.) ← Попередня версія | Поточна версія (різн.) | Новіша версія → (різн.)
Перейти до навігації Перейти до пошуку

В обробці зображень такомп'ютерному баченні, анізотропна дифузія, яка також називається  дифузією Перона–Маліка, є методом, який спрямований на зменшення шуму зображення, без видалення при цьому важливих частин вмісту зображення, як правило, країв, лінії або інших даних, які важливі для інтерпретації зображення.[1][2][3] Анізотропна дифузія нагадує процес, який створює масштабований простір, де зображення генерує параметризовану сім'ю все більш і більш розмитих зображень, заснованих на дифузійному процесі. Кожне з отриманих зображень в цій сім'ї подане як згортка між зображенням і 2D ізотропним фільтром Гауса, де ширина фільтра збільшується з параметром. Цей дифузійний процес є лінійним і просторово-інваріантним перетворенням вихідного зображення. Анізотропна дифузія є узагальненням цього дифузійного процесу: вона створює сімейство параметризованих зображень, але кожне отримане зображення являє собою поєднання вихідного зображення і фільтру, який залежить від початкового змісту вихідного зображення. Як наслідок, анізотропна дифузія є нелінійною і просторово-варіантною трансформацією вихідного зображення.

У своєму первісному формулюванні, яке представлене Пероном і Шаблон:Нп в 1987 році,[1] просторово-варіантний фільтр - це ізотропія, яка залежить від змісту зображення, так як вона наближається до імпульсної функції поблизу країв та інших структур, які повинні бути збережені в зображенні на різних рівнях в результаті масштабованого простору. Це формулювання  Перона і Малік називають анізотропною дифузією, а інші автори також неоднорідною і нелінійною дифузією[4] або ж дифузією Перона — Маліка[5]. Більш загальне формулювання дозволяє адаптованому до початкових умов фільтру  бути подібним до анізотропних об'єктів лінійної структури, таких як краї або лінії: його орієнтація задається такою структурою, що він витягнутий вздовж конструкції і вузький поперечному перерізі. Такі методи називаються формами-адаптованого згладжування[6][7]. Як наслідок, отримані зображення зберігають лінійні структури і в той же час проводиться згладжування уздовж цих структур. Обидва випадки можуть бути описані за допомогою узагальнення звичайного рівняння дифузії, де коефіцієнт дифузії, замість того, щоб бути постійним скаляром, є функцією позиції зображення і передбачає  матричне (або тензорне) значення (див. структурний тензор).

Хоч отриману сім'ю знімків можна охарактеризувати як поєднання оригінального зображення і просторово-варіантних фільтрів, адаптований до початкових умов фільтр і його комбінація із зображенням не повинні бути реалізовані на практиці. Анізотропна дифузія зазвичай реалізовується за допомогою апроксимації узагальненого рівняння дифузії: кожне нове зображення в сім'ї обчислюється за допомогою  застосування  цього рівняння до попереднього зображення. Отже, анізотропна дифузія являє собою ітераційний процес, в якому відносно простий набір обчислень використовується для обчислення кожного наступного зображення в сім'ї і цей процес продовжується до отримання достатнього ступеня гладкості.

Формальне визначення

Формально, нехай Ω2 позначає підмножину площини і I(,t):Ω - сім'я напівтонових зображень. Тоді анізотропна дифузія визначається як

It=div(c(x,y,t)I)=cI+c(x,y,t)ΔI

де Δ позначає оператор Лапласа, позначає градієнт, div() це дивергенція оператора і c(x,y,t) - коефіцієнт дифузії. c(x,y,t) контролює швидкість дифузії і зазвичай вибирається як функція градієнта зображення, так як це зберігає краї зображення. П'єтро Перона і Джітендра Малік вперше представили ідею анізотропної дифузії в 1990 році і запропонували дві функції для коефіцієнта дифузії:

c(I)=e(I/K)2

і

c(I)=11+(IK)2

константа K  визначає чутливість до країв і, як правило, визначається експериментально або ж як функція шуму на зображенні.

Мотивація

НехайM позначає копію гладких зображень. Тоді дифузійні рівняння, представлені вище, можуть бути інтерпретовані як рівняння градієнтного спуску для мінімізації енергії E:M визначеної як:

E[I]=12Ωg(I(x)2)dx

де g: є дійсною функцією і яка тісно пов'язана з коефіцієнтом дифузії. Тоді для будь-якої фінітної, нескінченно диференційовної тестової функції h, маємо

ddt|t=0E[I+th]=ddt|t=012Ωg((I+th)(x)2)dx=Ωg(I(x)2)Ihdx=Ωdiv(g(I(x)2)I)hdx

де останній рядок випливає з багатовимірного інтегрування частинами. Через EI позначимо градієнт E щодо L2(Ω,) прегільбертового простору оцінений в I. Це дає

EI=div(g(I(x)2)I)

Таким чином, градієнтний спуск рівняння заданий як

It=EI=div(g(I(x)2)I)

Тоді, взявши c=g ми отримуємо анізотропне рівняння дифузії.

Регуляризація

У цьому розділі буде обговорюватись регуляризація Перона-Маліка. При такому підході, невідоме скручується з Гауссіаном всередині нелінійності для отримання модифікованих рівнянь Перона-Маліка.

It=div(c(|DGσ*I|)I)

де Gσ=Cσ(1/2)exp(|x|2/4σ).

Коректність цього рівняння може бути досягнута шляхом регуляризації, а також за допомогою введення ефекту розмитості, який є основним недоліком регуляризації. Необхідно також мати попередні знання про рівень шуму, оскільки вибір параметра регуляризації залежить від нього.

Застосування

Анізотропна дифузія може бути використана для видалення шуму з цифрових зображень без розмиття країв. З постійним коефіцієнтом дифузії, анізотропне рівняння дифузії зводяться до рівняння теплопровідності, яке еквівалентне Гаусовому розмиттю. Це ідеально підходить для видалення шумів, але і безрозбірно розмиває краї теж. Коли коефіцієнт дифузії є обраний як функція для пошуку границі, як, наприклад, у Перона[8] і Маліка, отримані рівняння підтримують дифузію (і, отже, згладжування) усередині областей, а також забороняти її вздовж границь. Отже, краї зображення можуть бути збережені під час видалення шуму зображення.

Див. також

Примітки

Шаблон:Reflist

Посилання

Шаблон:Ізольована стаття

  1. 1,0 1,1 Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Perona-Malik-1987 не вказано текст
  2. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Perona-Malik-1990 не вказано текст
  3. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Sapiro-2001 не вказано текст
  4. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Weickert-review не вказано текст
  5. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою Jähne-Haußecker-2000 не вказано текст
  6. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою lin94 не вказано текст
  7. Помилка цитування: Неправильний виклик тегу <ref>: для виносок під назвою AlmLin00 не вказано текст
  8. http://www.vision.caltech.edu Шаблон:Webarchive