Істотна матриця

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

У комп'ютерному зорі істотною матрицею є a 3×3 матриця 𝐄 що пов'язує відповідні точки на стереозображеннях, припускаючи, що камери задовольняють моделі камери обскури.

Функція

Більш конкретно, якщо 𝐲 і 𝐲 є однорідними нормалізованими координатами зображення на зображеннях 1 та 2 відповідно, тоді

(𝐲)𝐄𝐲=0

якщо 𝐲 і 𝐲 відповідають одній і тій же 3D точці на сцені.

Вищезазначене співвідношення, яке визначає істотну матрицю, було опубліковане у 1981 р. Х. Крістофером Лонге-Хіггінсом. У книзі Лонге-Хіггінса наводиться алгоритм оцінки 𝐄 з набору відповідних нормалізованих координат зображення, а також алгоритм визначення відносного положення та орієнтації двох камер за відомою 𝐄. Нарешті, показано, як за допомогою істотної матриці можна визначити 3D-координати точок зображення.

Використання

Істотну матрицю можна розглядати як попередник фундаментальної матриці. Обидві матриці можна використовувати для встановлення звʼязку між відповідними точками зображень, але істотну матрицю можна використовувати лише щодо каліброваних камер, оскільки внутрішні параметри камери повинні бути відомі для досягнення нормалізації. Однак, якщо камери відкалібровані, істотна матриця може бути корисною для визначення як відносного положення, так і орієнтації між камерами та положення 3D відповідних точок зображення.

Виведення та визначення

Виведення згідно з роботою Лонге-Хіггінса.

Дві нормалізовані камери проєктують 3D-світ на свої відповідні площини зображення. Позначимо 3D координати точки Р у системах координат кожної камери як (x1,x2,x3) і (x'1,x'2,x'3). Оскільки камери нормалізовані, відповідні координати зображення

(y1y2)=1x3(x1x2) і (y'1y'2)=1x'3(x'1x'2)

Тоді однорідні координати можна записати як

(y1y21)=1x3(x1x2x3) і (y'1y'21)=1x'3(x'1x'2x'3)

або більш компактно

𝐲=1x3𝐱~ і 𝐲=1x'3𝐱~

де 𝐲 і 𝐲 є однорідними 2D координатами зображення, а 𝐱~ і 𝐱~ тривимірні координати у двох різних системах координат.

Ще однією властивістю нормалізованих камер є те, що їх відповідні системи координат пов'язані за допомогою зсуву та обертання. Це означає, що два набори тривимірних координат пов'язані як

𝐱~=𝐑(𝐱~𝐭)

де 𝐑 є 3×3 матрицею повороту і 𝐭 є тривимірним вектором зсуву.

Тоді істотна матриця визначається як:

𝐄=𝐑[𝐭]×

де [𝐭]× є матричним записом векторного добутку з 𝐭.

Щоб продемонструвати, що це визначення істотної матриці описує звʼязок відповідних координат зображення помножимо 𝐄 зліва та справа на 3D-координати точки P у двох різних системах координат:

(𝐱~)T𝐄𝐱~=(1)(𝐱~𝐭)T𝐑T𝐑[𝐭]×𝐱~=(2)(𝐱~𝐭)T[𝐭]×𝐱~=(3)0
  1. Використано наведене вище співвідношення між 𝐱~ і 𝐱~ та визначення 𝐄 через 𝐑 і 𝐭.
  2. 𝐑T𝐑=𝐈 оскільки матриця обертання 𝐑 є ортогональною матрицею.
  3. Властивість матричного запису векторного добутку.

Нарешті, можна припустити, що обидва x3 і x'3 > 0, інакше їх не видно в обох камерах. Це дає

0=(𝐱~)T𝐄𝐱~=1x'3(𝐱~)T𝐄1x3𝐱~=(𝐲)T𝐄𝐲

що є звʼязком між відповідними точками зображення, який визначає істотна матриця.

Властивості

Результатом множення істотної матриці 𝐄 на ненульовий скаляр, є істотна матриця, яка визначає точно такий же звʼязок, як і 𝐄. Це означає що 𝐄 можна розглядати як елемент проєктивного простору, тобто дві такі матриці вважаються еквівалентними, якщо одна є ненульовим скалярним множенням іншої. Це є важливою властивістю, якщо 𝐄 визначається за даними зображень. Однак можна також визначити 𝐄 як

𝐄=[𝐭~]×𝐑

де 𝐭~=𝐑𝐭, і тоді 𝐄 задає чітко визначене масштабування. На практиці реалізації алгоритмів можуть використовувати обидві форми.

Звʼязок також може бути виражений як

det𝐄=0

і

2𝐄𝐄T𝐄tr(𝐄𝐄T)𝐄=0.

Тут останнє рівняння є обмеженням матриці, яке можна розглядати як 9 обмежень, по одному для кожного елемента матриці. Ці обмеження часто використовуються для визначення суттєвої матриці з п'яти відповідних пар точок.

Істотна матриця має п’ять-шість ступенів вільності, залежно від того, розглядається вона як проєктивний елемент чи ні. Матриця обертання 𝐑 і вектор зсуву 𝐭 мають три ступені вільності кожен, а загалом їх шість. Якщо суттєву матрицю розглядати як проєктивний елемент потрібно відняти один ступінь свободи, пов'язану зі скалярним множенням, залишаючи в цілому п'ять ступенів свободи.

Оцінка

Враховуючи набір відповідних точок зображення, можна оцінити істотну матрицю, яка задовольняє визначальному епіполярному обмеженню для всіх точок набору. Однак, якщо точки зображення зашумлені, що є типовим випадком у будь-якій практичній ситуації, неможливо знайти істотну матрицю, яка б точно задовольняла всім обмеження.

Залежно від того, як враховується похибка, пов'язана з кожним обмеженням, можна визначити або оцінити істотну матрицю, яка оптимально задовольняє всім обмеженням для даного набору відповідних точок зображення. Найпростіший підхід полягає в постановці загальної задачі найменших квадратів, широко відомої як восьмиточковий алгоритм.

Визначення повороту та зсуву з істотної матриці

Враховуючи, що істотна матриця була визначена для пари стереокамер — наприклад, за допомогою методу оцінки наведеного вище — ця матриця може бути використана для визначення повороту 𝐑 та зсув 𝐭 між системами координат цих двох камер. У цьому частинному випадку 𝐄 розглядається як проєктивний елемент, та не визначає масштаб.

Знаходження першого розв'язку

Наведений нижче спосіб знаходження матриці повороту 𝐑 та вектора зсуву 𝐭 засновано на виконанні сингулярного розкладу 𝐄т. Також можливо визначити 𝐑 та 𝐭 без використання сингулярного розкладу.

Сингулярний розклад 𝐄 дає

𝐄=𝐔Σ𝐕T

де 𝐔 та 𝐕 отрогональні 3×3 матриці та Σ є 3×3 діагональною матрицею з елементами

Σ=(s000s0000)

Діагональні елементи Σ є сингулярними значеннями 𝐄 які, згідно з властивостями істотної матриці повинні містити два однакових і одне нульове значення. Позначимо

𝐖=(010100001)   для неї   𝐖1=𝐖T=(010100001)

і зробимо наступний анзац

[𝐭]×=𝐔𝐖Σ𝐔T
𝐑=𝐔𝐖1𝐕T

Оскільки Σ може не повністю задовольняти всім обмеженням при роботі з реальними даними, може допомогти альтернатива

[𝐭]×=𝐔𝐙𝐔T   де   𝐙=(010100000)
𝐑=𝐔𝐖1𝐕T

Пошук усіх розв'язків

Знайдений можливий розв'язок для 𝐑 та 𝐭 для матриці 𝐄 не є єдиним, він може виявитися навіть недійсним з урахуванням реального розташування камер.

Для 𝐄 існує два протилежних напрямки для 𝐭, й два різних обертання (яким відповідає 𝐖 та 𝐖1, що сумісні із даною істотною матрицею. Всього це дає чотири розв'язки для зсуву та повороту між системами координат двох камер. Однак на практиці три розв'язки завжди відповідають тривимірній точці, що знаходиться позаду хоча б однієї з камер і тому не може бути видима. Тільки один з чотирьох розв'язків відповідає точкам, що знаходяться попереду обох камер і лише цей розв'язок є вірним.

Знаходження 3D-точок з відповідних точок зображення

Існує багато методів обчислень (x1,x2,x3) за відповідними нормованими координатами зображення (y1,y2) і (y'1,y'2), якщо істотна матриця відома і були визначені відповідні перетворення обертання та паралельного перенесення камери.

Дивитися також

Інструменти

Перелік джерел

Шаблон:Refbegin

Шаблон:Refend