Активное зрение - Active vision

Площадь компьютерное зрение является активное зрение, иногда также называемый активное компьютерное зрение. Активная система видения - это система, которая может управлять точкой обзора камеры (камер), чтобы исследовать окружающую среду и получать от нее более точную информацию.[1][2][3][4]

Фон

Интерес к системам активных камер появился еще два десятилетия назад. Начиная с конца 1980-х годов Aloimonos et al. представила первую общую структуру для активного зрения, чтобы улучшить качество восприятия результатов отслеживания.[3] Активное зрение особенно важно для решения таких проблем, как окклюзия, ограниченное поле зрения и ограниченное разрешение камеры.[5] Другими преимуществами могут быть уменьшение размытости движущегося объекта. [6] и улучшение восприятия глубины объекта за счет фокусировки двух камер на одном объекте или перемещения камер.[3] Активное управление точкой обзора камеры также помогает сосредоточить вычислительные ресурсы на соответствующем элементе сцены.[7] В этом избирательном аспекте активное зрение можно рассматривать как строго связанное с (явным и скрытым) зрительным вниманием у биологических организмов, которое, как было показано, усиливает восприятие выбранной части поля зрения. Этот избирательный аспект человеческого (активного) зрения можно легко связать с фовеальной структурой человеческого глаза.[8][9] где примерно в 5% сетчатки расположено более 50% цветовых рецепторов.

Также было высказано предположение, что визуальное внимание и выборочный аспект активного управления камерой могут помочь в других задачах, таких как изучение более надежных моделей объектов и сред с менее маркированными образцами или автономно.[4][10]

[11]

Подходы

Подход автономной камеры

Автономные камеры - это камеры, которые могут ориентироваться в окружающей среде. В последнее время был проведен ряд работ с использованием этого подхода. В работе Дензлера и др. Движение отслеживаемого объекта моделируется с использованием фильтра Калмана, в то время как используется фокусное расстояние, которое минимизирует неопределенность в оценках состояния. Использовалась стереосистема с двумя зум-камерами. Несколько статей было написано для управления масштабированием и не касается общей оценки положения объекта и камеры. Попытку объединить оценку и контроль в одной структуре можно найти в работе Багданова и др., Где камера Pan-Tilt-Zoom используется для отслеживания лиц.[12] Используемые модели оценки и управления являются специальными, и подход к оценке основан на характеристиках изображения, а не на трехмерных свойствах отслеживаемой цели.[13]

Подход ведущий / ведомый

В конфигурации ведущий / ведомый используется наблюдающая статическая камера для наблюдения за широким полем обзора и отслеживания каждой движущейся интересующей цели. Положение каждой из этих целей с течением времени затем передается фовеальной камере, которая пытается наблюдать цели с более высоким разрешением. И статическая, и активная камеры откалиброваны по общему эталону, поэтому данные, поступающие с одной из них, можно легко проецировать на другую, чтобы координировать управление активными датчиками. Другое возможное использование подхода ведущий / ведомый состоит из статической (ведущей) камеры, извлекающей визуальные характеристики интересующего объекта, в то время как активный (ведомый) датчик использует эти функции для обнаружения желаемого объекта без необходимости каких-либо обучающих данных.[13][14]

Сетевой подход с активными камерами

В последние годы растет интерес к созданию сетей из активных камер и дополнительных статических камер, чтобы вы могли охватить большую площадь, сохраняя при этом высокое разрешение нескольких целей. В конечном итоге это увеличенная версия подхода «ведущий / ведомый» или автономной камеры. Этот подход может быть очень эффективным, но при этом невероятно дорогостоящим. Здесь задействовано не только несколько камер, но и необходимо, чтобы они обменивались данными друг с другом, что может быть дорогостоящим в вычислительном отношении.[13][14]

Контролируемая система активного зрения

Управляемое активное зрение можно определить как управляемое движение датчика зрения, которое может максимизировать производительность любого роботизированного алгоритма, в котором используется движущийся датчик зрения. Это гибрид теории управления и традиционного видения. Применение этой структуры - роботизированное сервоуправление в реальном времени вокруг статических или движущихся произвольных трехмерных объектов. См. «Визуальное сервоуправление». Алгоритмы, которые включают использование нескольких окон и численно устойчивые меры доверия, объединяются со стохастическими контроллерами, чтобы обеспечить удовлетворительное решение проблемы слежения, возникающей путем объединения компьютерного зрения и управления. В случае неточной модели окружающей среды могут быть введены методы адаптивного управления. Вышеупомянутую информацию и дальнейшие математические представления управляемого активного зрения можно увидеть в диссертации Николаоса Папаниколопулоса.[15]

Примеры

Примеры систем активного зрения обычно включают камеру, установленную на роботе,[16] но в других системах используются камеры, устанавливаемые на человека оператором (также известные как «носимые устройства»).[17] Приложения включают автоматическое наблюдение, взаимодействие человека с роботом (видео),[18][19] SLAM, планирование маршрута,[20] и т. д. в DARPA Grand Challenge большинство команд использовали ЛИДАР в сочетании с системами активного обзора для управления беспилотными автомобилями по бездорожью.

Хороший пример активного зрения можно увидеть в этом видео на YouTube. Он показывает отслеживание лица с использованием активного зрения с системой панорамирования и наклона камеры. https://www.youtube.com/watch?v=N0FjDOTnmm0

Active Vision также важно понимать, как люди.[8][21]и организм, наделенный визуальными датчиками, действительно видит мир, учитывая пределы своих датчиков, богатство и непрерывную изменчивость визуального сигнала и влияние их действий и целей на их восприятие.[7][22][23]

Управляемая структура активного видения может использоваться по-разному. Некоторые примеры могут быть отслеживание транспортных средств, приложения для робототехники,[24] и интерактивная сегментация МРТ.[25]

Интерактивная сегментация МРТ использует управляемое активное зрение с помощью схемы управления Ляпанова, чтобы установить баланс между влиянием управляемого данными градиентного потока и действия человека во времени. Это плавно объединяет автоматическую сегментацию с интерактивностью. Более подробную информацию об этом методе можно найти в.[25] Сегментация на МРТ - сложная тема, и требуется эксперт, чтобы отследить желаемые сегменты, поскольку МРТ собирает всю жидкость и ткани. Это может оказаться непрактичным, поскольку это будет очень длительный процесс. Управляемые методы активного зрения, описанные в цитируемой статье, могут помочь улучшить процесс, меньше полагаясь на человека.

Различные загрузки различных реализаций активного зрения можно найти по этой ссылке на лабораторию активного зрения в Оксфордском университете. http://www.robots.ox.ac.uk/ActiveVision/Downloads/index.html

Внешняя ссылка

Рекомендации

  1. ^ http://axiom.anu.edu.au/~rsl/rsl_active.html
  2. ^ Баллард, Дана Х. (1991). «Живое зрение». Искусственный интеллект. 48: 57–86. Дои:10.1016/0004-3702(91)90080-4.
  3. ^ а б c Алоимонос, Джон; Вайс, Исаак; Bandyopadhyay, Амит (1988). «Активное зрение». Международный журнал компьютерного зрения. 1 (4): 333–356. Дои:10.1007 / BF00133571.
  4. ^ а б Огнибене, Дмитрий; Бальдассаре, Джанлука (2015). «Экологически активное видение: четыре биоинспектированных принципа интеграции снизу вверх и адаптивного внимания сверху вниз, протестированные с помощью простого робота с камерой». IEEE Transactions по автономному умственному развитию. 7: 3–25. Дои:10.1109 / TAMD.2014.2341351.
  5. ^ Дензлер; Зобель; Ниманн (2003). "Информационно-теоретический выбор фокусного расстояния для активного отслеживания 3D-объекта в реальном времени". Труды Девятой международной конференции IEEE по компьютерному зрению. С. 400–407 т.1. CiteSeerX  10.1.1.122.1594. Дои:10.1109 / ICCV.2003.1238372. ISBN  978-0-7695-1950-0. S2CID  17622133.
  6. ^ Ривлин, Эхуд; Ротштейн, Эктор (2000). «Управление камерой для активного зрения: фовеальное зрение, плавное отслеживание и саккада». Международный журнал компьютерного зрения. 39 (2): 81–96. Дои:10.1023 / А: 1008166825510.
  7. ^ а б Tatler, B.W .; Hayhoe, M. M .; Land, M. F .; Баллард, Д. Х. (2011). «Управление глазами при естественном зрении: переосмысление значимости». Журнал видения. 11 (5): 5. Дои:10.1167/11.5.5. ЧВК  3134223. PMID  21622729.
  8. ^ а б Финдли, Дж. М. и Гилкрист, И. Д. Активное зрение, Психология взгляда и видения Oxford University Press, 2003 г.
  9. ^ Тистарелли, М .; Сандини, Г. (1993). «О преимуществах полярного и лог-полярного картирования для прямой оценки времени воздействия оптического потока». IEEE Transactions по анализу шаблонов и машинному анализу. 15 (4): 401–410. CiteSeerX  10.1.1.49.9595. Дои:10.1109/34.206959.
  10. ^ Вальтер, Дирк; Рутисхаузер, Ули; Кох, Кристоф; Перона, Пьетро (2005). «Выборочное визуальное внимание позволяет изучать и распознавать несколько объектов в загроможденных сценах» (PDF). Компьютерное зрение и понимание изображений. 100 (1–2): 41–63. CiteSeerX  10.1.1.110.976. Дои:10.1016 / j.cviu.2004.09.004.
  11. ^ Larochelle, H .; Хинтон, Г. (6 декабря 2010 г.). «Обучение сочетанию фовеальных проблесков с машиной Больцмана третьего порядка» (PDF). Материалы 23-й Международной конференции по системам обработки нейронной информации.. 1. С. 1243–1251.
  12. ^ Багданов, А.Д .; Дель Бимбо, А .; Нунциати, В. (2006). «Повышение доказательного качества изображений наблюдения за счет активного отслеживания лиц». 18-я Международная конференция по распознаванию образов (ICPR'06). С. 1200–1203. Дои:10.1109 / ICPR.2006.700. ISBN  978-0-7695-2521-1.
  13. ^ а б c Аль-Хадж, Мурад; Фернандес, Карлес; Xiong, Zhanwu; Уэрта, Иван; Гонсалес, Хорди; Рока, Ксавьер (2011). «За пределами статической камеры: проблемы и тенденции активного зрения». Визуальный анализ людей. С. 11–30. Дои:10.1007/978-0-85729-997-0_2. ISBN  978-0-85729-996-3.
  14. ^ а б Беллотто, Никола; Бенфолд, Бен; Харланд, Ханно; Нагель, Ханс-Хельмут; Пирло, Никола; Рид, Ян; Соммерлейд, Эрик; Чжао, Чуань (2012). «Когнитивное визуальное слежение и управление камерой» (PDF). Компьютерное зрение и понимание изображений. 116 (3): 457–471. Дои:10.1016 / j.cviu.2011.09.011.
  15. ^ Папаниколопулос, Николаос Панайотис (1992). Контролируемое активное зрение (Кандидатская диссертация). Университет Карнеги Меллон.
  16. ^ Мак, Лин Чи; Фурукава, Томонари; Уитти, Марк (2008). «Система локализации внутреннего винтокрылого MAV с использованием светодиодов, установленных на лопастях». Обзор датчика. 28 (2): 125–131. Дои:10.1108/02602280810856688.
  17. ^ Нанесение на карту больших петель с помощью одной ручной камеры.LA Клементе, AJ Davison, ID Reid, J Neira, JD Tardós - Робототехника: наука и системы, 2007
  18. ^ Демирис, Яннис; Хадхури, Бассам (2006). «Иерархические внимательные множественные модели для исполнения и распознавания действий». Робототехника и автономные системы. 54 (5): 361–369. CiteSeerX  10.1.1.226.5282. Дои:10.1016 / j.robot.2006.02.003.
  19. ^ На пути к активному признанию событий Д. Огнибене, Ю. Демирис 23-я Международная совместная конференция по искусственному интеллекту (IJCAI13)
  20. ^ http://www.surrey.ac.uk/eng/research/mechatronics/robots/Activities/ActiveVision/activevis.html В архиве 17 августа 2007 г. Wayback Machine
  21. ^ Земля, Майкл Ф. (2006). «Движение глаз и контроль действий в повседневной жизни» (PDF). Прогресс в исследованиях сетчатки и глаз. 25 (3): 296–324. Дои:10.1016 / j.preteyeres.2006.01.002. PMID  16516530.
  22. ^ Лунгарелла, Макс; Sporns, Олаф (2006). «Отображение информационного потока в сенсомоторных сетях». PLOS вычислительная биология. 2 (10): e144. Bibcode:2006PLSCB ... 2..144L. Дои:10.1371 / journal.pcbi.0020144. ЧВК  1626158. PMID  17069456.
  23. ^ Verschure, Paul F. M. J .; Фогтлин, Томас; Дуглас, Родни Дж. (2003). «Экологически опосредованная синергия между восприятием и поведением мобильных роботов». Природа. 425 (6958): 620–624. Bibcode:2003Натура.425..620В. Дои:10.1038 / природа02024. PMID  14534588.
  24. ^ Smith, C.E .; Папаниколопулос, Н.П .; Брандт, С.А. (1994). «Применение управляемой системы активного зрения к робототехническим и транспортным задачам». Труды семинара IEEE 1994 г. по приложениям компьютерного зрения. С. 213–220. CiteSeerX  10.1.1.40.3470. Дои:10.1109 / ACV.1994.341311. ISBN  978-0-8186-6410-6.
  25. ^ а б Карасев, Петр; Колесов, Иван; Чуды, Кароль; Танненбаум, Аллен; Мюллер, Грант; Ксерогей, Джон (2011). «Интерактивная сегментация МРТ с управляемым активным зрением». 2011 50-я конференция IEEE по решениям и контролю и Европейская конференция по контролю. С. 2293–2298. Дои:10.1109 / CDC.2011.6161453. ISBN  978-1-61284-801-3. ЧВК  3935399. PMID  24584213.