Дальность изображения - Range imaging

Дальность изображения - это название набора методов, которые используются для создания 2D-изображения, показывающего расстояние до точек в сцене из определенной точки, обычно связанной с каким-либо типом сенсорного устройства.

Получившееся изображение, изображение диапазона, имеет значения пикселей, соответствующие расстоянию. Если датчик, который используется для создания изображения диапазона, правильно откалиброван, значения пикселей могут быть указаны непосредственно в физических единицах, таких как метры.

Различные типы камер диапазона

Сенсорное устройство, которое используется для получения изображения дальности, иногда называют камера диапазона. Камеры дальнего действия могут работать в соответствии с рядом различных методов, некоторые из которых представлены здесь.

Стереотриангуляция

Стереотриангуляция - это применение стереофотограмметрия где данные глубины пикселей определяются из данных, полученных с использованием стерео или же установка нескольких камер система. Таким образом можно определить глубину до точек в сцене, например, от центральной точки линии между их фокусными точками. Чтобы решить проблему измерения глубины с помощью системы стереокамеры, необходимо сначала найти соответствующие точки на разных изображениях. Решение проблема переписки это одна из основных проблем при использовании этого типа техники. Например, трудно решить проблему соответствия для точек изображения, которые лежат внутри областей однородной интенсивности или цвета. Как следствие, построение изображений дальности на основе стереотриангуляции обычно может давать надежные оценки глубины только для подмножества всех точек, видимых в нескольких камерах.

Преимущество этого метода в том, что измерение более или менее пассивно; не требует особых условий по освещению сцены. Другие упомянутые здесь методы не должны решать проблему соответствия, а зависят от конкретных условий освещения сцены.

Лист световой триангуляции

Если сцена освещена полосой света, это создает отраженную линию, видимую от источника света. Из любой точки вне плоскости листа линия обычно выглядит как кривая, точная форма которой зависит как от расстояния между наблюдателем и источником света, так и от расстояния между источником света и отраженными точками. Наблюдая за отраженным светом с помощью камеры (часто камеры с высоким разрешением) и зная положения и ориентации как камеры, так и источника света, можно определить расстояния между отраженными точками и источником света или камерой.

Перемещая либо источник света (и обычно также камеру), либо сцену перед камерой, можно сгенерировать последовательность профилей глубины сцены. Их можно представить как двумерное изображение диапазона.

Структурированный свет

Освещая сцену специально разработанным световым узором, структурированный свет, глубину можно определить, используя только одно изображение отраженного света. Структурированный свет может быть в виде горизонтальных и вертикальных линий, точек или рисунков на доске. А световая сцена в основном представляет собой универсальное устройство формирования изображений со структурированным световым диапазоном, первоначально созданное для работы захват отражательной способности.

Время полета

Глубину также можно измерить с помощью стандартного метода измерения времени пролета (ToF), более или менее похожего на радар, в том, что создается изображение дальности, подобное изображению радара, за исключением того, что вместо РЧ-импульса используется световой импульс. Это также мало чем отличается от ЛИДАР, за исключением того, что ToF не требует сканирования, то есть вся сцена захватывается с помощью одного светового импульса, в отличие от поэтапной съемки с помощью вращающегося лазерного луча. Времяпролетные камеры являются относительно новыми устройствами, которые захватывают всю сцену в трех измерениях с помощью специального датчика изображения и, следовательно, не нуждаются в движущихся частях. Времяпролетный лазерный радар с быстрым стробированием усиленная камера CCD достигает субмиллиметрового разрешения по глубине. С помощью этого метода короткий лазерный импульс освещает сцену, а усиленная ПЗС-камера открывает свой высокоскоростной затвор всего на несколько сотен. пикосекунды. Трехмерная информация вычисляется из серии двухмерных изображений, собранных с увеличением задержки между лазерным импульсом и открытием затвора.[1]

Интерферометрия

Освещая точки с помощью когерентный свет и измеряя фазовый сдвиг отраженного света относительно источника света, можно определить глубину. В предположении, что изображение истинного диапазона является более или менее непрерывной функцией координат изображения, правильная глубина может быть получена с помощью метода, называемого фазовым разворачиванием. Видеть наземная интерферометрия SAR.

Кодированная апертура

Информация о глубине может быть частично или полностью выведена вместе с интенсивностью посредством обратной свертки изображения, захваченного специально разработанным кодированная апертура узор с особым сложным расположением отверстий, через которые входящий свет либо пропускается, либо блокируется. Сложная форма диафрагмы создает неравномерное размытие изображения для тех частей сцены, которые не находятся в фокальной плоскости объектива. Степень размытости сцены, которая связана со смещением от фокальной плоскости, может использоваться для определения глубины.[2]

Чтобы определить размер размытия (необходимого для декодирования информации о глубине) в захваченном изображении, можно использовать два подхода: 1) удаление размытия захваченное изображение с различными размытиями, или 2) изучение некоторых линейных фильтров, которые определяют тип размытия.

Первый подход использует правильную математическую деконволюцию, которая учитывает известный шаблон проектирования апертуры; эта деконволюция может определить, где и в какой степени сцена стала извилистой из-за того, что не в фокусе свет выборочно падает на поверхность захвата, и обратить процесс вспять.[3] Таким образом, сцену без размытия можно получить вместе с размером размытия.

Второй подход вместо этого извлекает степень размытия, минуя восстановление изображения без размытия, и, следовательно, без выполнения обратной свертки. Используя Анализ главных компонентов (PCA), метод изучает автономно банк фильтров, которые однозначно идентифицируют каждый размер размытия; эти фильтры затем применяются непосредственно к захваченному изображению, как обычная свертка.[4] Ключевым преимуществом этого подхода является то, что не требуется никакой информации о кодированной диаграмме апертуры. Из-за своей эффективности этот алгоритм также был распространен на видеопоследовательности с движущимися и деформируемыми объектами.[5]

Поскольку глубина точки определяется по степени размытия, вызванной распространением света из соответствующей точки в сцене, попадающим по всей поверхности апертуры и искажающимся в соответствии с этим распространением, это сложная форма стереотриангуляции. Каждая точка изображения эффективно пространственно дискретизируется по ширине апертуры.

Эта технология в последнее время используется в iPhone X. Многие другие телефоны от Samsung и компьютеры из Microsoft пытались использовать эту технологию, но они не используют трехмерное отображение.

Смотрите также

Рекомендации

  1. ^ Высокоточный лазерный 3D-радар Йенс Буск и Хеннинг Гейзельберг, Tekniske University, Дания, 2004 г.
  2. ^ Мартинелло, Мануэль (2012). Кодированная апертурная визуализация (PDF). Университет Хериот-Ватт.
  3. ^ Изображение и глубина с обычной камеры с кодированной апертурой Анат Левин, Роб Фергус, Фредо Дюран, Уильям Т. Фриман, Массачусетский технологический институт
  4. ^ Мартинелло, Мануэль; Фаваро, Паоло (2011). «Слепая деконволюция одиночного изображения со статистикой текстуры более высокого порядка» (PDF). Обработка видео и вычислительное видео, LNCS 7082. Конспект лекций по информатике. Springer-Verlag. 7082: 124–151. Дои:10.1007/978-3-642-24870-2_6. ISBN  978-3-642-24869-6.
  5. ^ Мартинелло, Мануэль; Фаваро, Паоло (2012). «Оценка глубины из видеопоследовательности с движущимися и деформируемыми объектами» (PDF). Конференция IET по обработке изображений: 131. Дои:10.1049 / cp.2012.0425. ISBN  978-1-84919-632-1.
  • Бернд Яне (1997). Практическое руководство по обработке изображений для научных приложений. CRC Press. ISBN  0-8493-8906-2.
  • Линда Г. Шапиро и Джордж К. Стокман (2001). Компьютерное зрение. Прентис Холл. ISBN  0-13-030796-3.
  • Дэвид А. Форсайт и Жан Понсе (2003). Компьютерное зрение, современный подход. Прентис Холл. ISBN  0-12-379777-2.