Активное зрение - Active vision

Площадь компьютерное зрение является активное зрение, иногда также называемый активное компьютерное зрение. Активная система видения - это система, которая может управлять точкой обзора камеры (камер), чтобы исследовать окружающую среду и получать от нее более точную информацию.^[1]^[2]^[3]^[4]

Фон

Интерес к системам активных камер появился еще два десятилетия назад. Начиная с конца 1980-х годов Aloimonos et al. представила первую общую структуру для активного зрения, чтобы улучшить качество восприятия результатов отслеживания.^[3] Активное зрение особенно важно для решения таких проблем, как окклюзия, ограниченное поле зрения и ограниченное разрешение камеры.^[5] Другими преимуществами могут быть уменьшение размытости движущегося объекта. ^[6] и улучшение восприятия глубины объекта за счет фокусировки двух камер на одном объекте или перемещения камер.^[3] Активное управление точкой обзора камеры также помогает сосредоточить вычислительные ресурсы на соответствующем элементе сцены.^[7] В этом избирательном аспекте активное зрение можно рассматривать как строго связанное с (явным и скрытым) зрительным вниманием у биологических организмов, которое, как было показано, усиливает восприятие выбранной части поля зрения. Этот избирательный аспект человеческого (активного) зрения можно легко связать с фовеальной структурой человеческого глаза.^[8]^[9] где примерно в 5% сетчатки расположено более 50% цветовых рецепторов.

Также было высказано предположение, что визуальное внимание и выборочный аспект активного управления камерой могут помочь в других задачах, таких как изучение более надежных моделей объектов и сред с менее маркированными образцами или автономно.^[4]^[10]

^[11]

Подходы

Подход автономной камеры

Автономные камеры - это камеры, которые могут ориентироваться в окружающей среде. В последнее время был проведен ряд работ с использованием этого подхода. В работе Дензлера и др. Движение отслеживаемого объекта моделируется с использованием фильтра Калмана, в то время как используется фокусное расстояние, которое минимизирует неопределенность в оценках состояния. Использовалась стереосистема с двумя зум-камерами. Несколько статей было написано для управления масштабированием и не касается общей оценки положения объекта и камеры. Попытку объединить оценку и контроль в одной структуре можно найти в работе Багданова и др., Где камера Pan-Tilt-Zoom используется для отслеживания лиц.^[12] Используемые модели оценки и управления являются специальными, и подход к оценке основан на характеристиках изображения, а не на трехмерных свойствах отслеживаемой цели.^[13]

Подход ведущий / ведомый

В конфигурации ведущий / ведомый используется наблюдающая статическая камера для наблюдения за широким полем обзора и отслеживания каждой движущейся интересующей цели. Положение каждой из этих целей с течением времени затем передается фовеальной камере, которая пытается наблюдать цели с более высоким разрешением. И статическая, и активная камеры откалиброваны по общему эталону, поэтому данные, поступающие с одной из них, можно легко проецировать на другую, чтобы координировать управление активными датчиками. Другое возможное использование подхода ведущий / ведомый состоит из статической (ведущей) камеры, извлекающей визуальные характеристики интересующего объекта, в то время как активный (ведомый) датчик использует эти функции для обнаружения желаемого объекта без необходимости каких-либо обучающих данных.^[13]^[14]

Сетевой подход с активными камерами

В последние годы растет интерес к созданию сетей из активных камер и дополнительных статических камер, чтобы вы могли охватить большую площадь, сохраняя при этом высокое разрешение нескольких целей. В конечном итоге это увеличенная версия подхода «ведущий / ведомый» или автономной камеры. Этот подход может быть очень эффективным, но при этом невероятно дорогостоящим. Здесь задействовано не только несколько камер, но и необходимо, чтобы они обменивались данными друг с другом, что может быть дорогостоящим в вычислительном отношении.^[13]^[14]

Контролируемая система активного зрения

Управляемое активное зрение можно определить как управляемое движение датчика зрения, которое может максимизировать производительность любого роботизированного алгоритма, в котором используется движущийся датчик зрения. Это гибрид теории управления и традиционного видения. Применение этой структуры - роботизированное сервоуправление в реальном времени вокруг статических или движущихся произвольных трехмерных объектов. См. «Визуальное сервоуправление». Алгоритмы, которые включают использование нескольких окон и численно устойчивые меры доверия, объединяются со стохастическими контроллерами, чтобы обеспечить удовлетворительное решение проблемы слежения, возникающей путем объединения компьютерного зрения и управления. В случае неточной модели окружающей среды могут быть введены методы адаптивного управления. Вышеупомянутую информацию и дальнейшие математические представления управляемого активного зрения можно увидеть в диссертации Николаоса Папаниколопулоса.^[15]

Примеры

Примеры систем активного зрения обычно включают камеру, установленную на роботе,^[16] но в других системах используются камеры, устанавливаемые на человека оператором (также известные как «носимые устройства»).^[17] Приложения включают автоматическое наблюдение, взаимодействие человека с роботом (видео),^[18]^[19] SLAM, планирование маршрута,^[20] и т. д. в DARPA Grand Challenge большинство команд использовали ЛИДАР в сочетании с системами активного обзора для управления беспилотными автомобилями по бездорожью.

Хороший пример активного зрения можно увидеть в этом видео на YouTube. Он показывает отслеживание лица с использованием активного зрения с системой панорамирования и наклона камеры. https://www.youtube.com/watch?v=N0FjDOTnmm0

Active Vision также важно понимать, как люди.^[8]^[21]и организм, наделенный визуальными датчиками, действительно видит мир, учитывая пределы своих датчиков, богатство и непрерывную изменчивость визуального сигнала и влияние их действий и целей на их восприятие.^[7]^[22]^[23]

Управляемая структура активного видения может использоваться по-разному. Некоторые примеры могут быть отслеживание транспортных средств, приложения для робототехники,^[24] и интерактивная сегментация МРТ.^[25]

Интерактивная сегментация МРТ использует управляемое активное зрение с помощью схемы управления Ляпанова, чтобы установить баланс между влиянием управляемого данными градиентного потока и действия человека во времени. Это плавно объединяет автоматическую сегментацию с интерактивностью. Более подробную информацию об этом методе можно найти в.^[25] Сегментация на МРТ - сложная тема, и требуется эксперт, чтобы отследить желаемые сегменты, поскольку МРТ собирает всю жидкость и ткани. Это может оказаться непрактичным, поскольку это будет очень длительный процесс. Управляемые методы активного зрения, описанные в цитируемой статье, могут помочь улучшить процесс, меньше полагаясь на человека.

Различные загрузки различных реализаций активного зрения можно найти по этой ссылке на лабораторию активного зрения в Оксфордском университете. http://www.robots.ox.ac.uk/ActiveVision/Downloads/index.html

Внешняя ссылка

Группа Активного Видения в Оксфордском университете.
Лаборатория активного зрения в Эдинбургском университете.
Система слежения за активным зрением для MAV разработан Университетом Нового Южного Уэльса.

Рекомендации

^ http://axiom.anu.edu.au/~rsl/rsl_active.html
^ Баллард, Дана Х. (1991). «Живое зрение». Искусственный интеллект. 48: 57–86. Дои:10.1016/0004-3702(91)90080-4.
^ ^а ^б ^c Алоимонос, Джон; Вайс, Исаак; Bandyopadhyay, Амит (1988). «Активное зрение». Международный журнал компьютерного зрения. 1 (4): 333–356. Дои:10.1007 / BF00133571.
^ ^а ^б Огнибене, Дмитрий; Бальдассаре, Джанлука (2015). «Экологически активное видение: четыре биоинспектированных принципа интеграции снизу вверх и адаптивного внимания сверху вниз, протестированные с помощью простого робота с камерой». IEEE Transactions по автономному умственному развитию. 7: 3–25. Дои:10.1109 / TAMD.2014.2341351.
^ Дензлер; Зобель; Ниманн (2003). "Информационно-теоретический выбор фокусного расстояния для активного отслеживания 3D-объекта в реальном времени". Труды Девятой международной конференции IEEE по компьютерному зрению. С. 400–407 т.1. CiteSeerX 10.1.1.122.1594. Дои:10.1109 / ICCV.2003.1238372. ISBN 978-0-7695-1950-0. S2CID 17622133.
^ Ривлин, Эхуд; Ротштейн, Эктор (2000). «Управление камерой для активного зрения: фовеальное зрение, плавное отслеживание и саккада». Международный журнал компьютерного зрения. 39 (2): 81–96. Дои:10.1023 / А: 1008166825510.
^ ^а ^б Tatler, B.W .; Hayhoe, M. M .; Land, M. F .; Баллард, Д. Х. (2011). «Управление глазами при естественном зрении: переосмысление значимости». Журнал видения. 11 (5): 5. Дои:10.1167/11.5.5. ЧВК 3134223. PMID 21622729.
^ ^а ^б Финдли, Дж. М. и Гилкрист, И. Д. Активное зрение, Психология взгляда и видения Oxford University Press, 2003 г.
^ Тистарелли, М .; Сандини, Г. (1993). «О преимуществах полярного и лог-полярного картирования для прямой оценки времени воздействия оптического потока». IEEE Transactions по анализу шаблонов и машинному анализу. 15 (4): 401–410. CiteSeerX 10.1.1.49.9595. Дои:10.1109/34.206959.
^ Вальтер, Дирк; Рутисхаузер, Ули; Кох, Кристоф; Перона, Пьетро (2005). «Выборочное визуальное внимание позволяет изучать и распознавать несколько объектов в загроможденных сценах» (PDF). Компьютерное зрение и понимание изображений. 100 (1–2): 41–63. CiteSeerX 10.1.1.110.976. Дои:10.1016 / j.cviu.2004.09.004.
^ Larochelle, H .; Хинтон, Г. (6 декабря 2010 г.). «Обучение сочетанию фовеальных проблесков с машиной Больцмана третьего порядка» (PDF). Материалы 23-й Международной конференции по системам обработки нейронной информации.. 1. С. 1243–1251.
^ Багданов, А.Д .; Дель Бимбо, А .; Нунциати, В. (2006). «Повышение доказательного качества изображений наблюдения за счет активного отслеживания лиц». 18-я Международная конференция по распознаванию образов (ICPR'06). С. 1200–1203. Дои:10.1109 / ICPR.2006.700. ISBN 978-0-7695-2521-1.
^ ^а ^б ^c Аль-Хадж, Мурад; Фернандес, Карлес; Xiong, Zhanwu; Уэрта, Иван; Гонсалес, Хорди; Рока, Ксавьер (2011). «За пределами статической камеры: проблемы и тенденции активного зрения». Визуальный анализ людей. С. 11–30. Дои:10.1007/978-0-85729-997-0_2. ISBN 978-0-85729-996-3.
^ ^а ^б Беллотто, Никола; Бенфолд, Бен; Харланд, Ханно; Нагель, Ханс-Хельмут; Пирло, Никола; Рид, Ян; Соммерлейд, Эрик; Чжао, Чуань (2012). «Когнитивное визуальное слежение и управление камерой» (PDF). Компьютерное зрение и понимание изображений. 116 (3): 457–471. Дои:10.1016 / j.cviu.2011.09.011.
^ Папаниколопулос, Николаос Панайотис (1992). Контролируемое активное зрение (Кандидатская диссертация). Университет Карнеги Меллон.
^ Мак, Лин Чи; Фурукава, Томонари; Уитти, Марк (2008). «Система локализации внутреннего винтокрылого MAV с использованием светодиодов, установленных на лопастях». Обзор датчика. 28 (2): 125–131. Дои:10.1108/02602280810856688.
^ Нанесение на карту больших петель с помощью одной ручной камеры.LA Клементе, AJ Davison, ID Reid, J Neira, JD Tardós - Робототехника: наука и системы, 2007
^ Демирис, Яннис; Хадхури, Бассам (2006). «Иерархические внимательные множественные модели для исполнения и распознавания действий». Робототехника и автономные системы. 54 (5): 361–369. CiteSeerX 10.1.1.226.5282. Дои:10.1016 / j.robot.2006.02.003.
^ На пути к активному признанию событий Д. Огнибене, Ю. Демирис 23-я Международная совместная конференция по искусственному интеллекту (IJCAI13)
^ http://www.surrey.ac.uk/eng/research/mechatronics/robots/Activities/ActiveVision/activevis.html В архиве 17 августа 2007 г. Wayback Machine
^ Земля, Майкл Ф. (2006). «Движение глаз и контроль действий в повседневной жизни» (PDF). Прогресс в исследованиях сетчатки и глаз. 25 (3): 296–324. Дои:10.1016 / j.preteyeres.2006.01.002. PMID 16516530.
^ Лунгарелла, Макс; Sporns, Олаф (2006). «Отображение информационного потока в сенсомоторных сетях». PLOS вычислительная биология. 2 (10): e144. Bibcode:2006PLSCB ... 2..144L. Дои:10.1371 / journal.pcbi.0020144. ЧВК 1626158. PMID 17069456.
^ Verschure, Paul F. M. J .; Фогтлин, Томас; Дуглас, Родни Дж. (2003). «Экологически опосредованная синергия между восприятием и поведением мобильных роботов». Природа. 425 (6958): 620–624. Bibcode:2003Натура.425..620В. Дои:10.1038 / природа02024. PMID 14534588.
^ Smith, C.E .; Папаниколопулос, Н.П .; Брандт, С.А. (1994). «Применение управляемой системы активного зрения к робототехническим и транспортным задачам». Труды семинара IEEE 1994 г. по приложениям компьютерного зрения. С. 213–220. CiteSeerX 10.1.1.40.3470. Дои:10.1109 / ACV.1994.341311. ISBN 978-0-8186-6410-6.
^ ^а ^б Карасев, Петр; Колесов, Иван; Чуды, Кароль; Танненбаум, Аллен; Мюллер, Грант; Ксерогей, Джон (2011). «Интерактивная сегментация МРТ с управляемым активным зрением». 2011 50-я конференция IEEE по решениям и контролю и Европейская конференция по контролю. С. 2293–2298. Дои:10.1109 / CDC.2011.6161453. ISBN 978-1-61284-801-3. ЧВК 3935399. PMID 24584213.

[1] ttp://axiom.anu.edu.au/~rsl/rsl_active.html

[2] Баллард, Дана Х. (1991). «Живое зрение». Искусственный интеллект. 48: 57–86. Дои:10.1016/0004-3702(91)90080-4.

[Aloimonos-3] а ^б ^c Алоимонос, Джон; Вайс, Исаак; Bandyopadhyay, Амит (1988). «Активное зрение». Международный журнал компьютерного зрения. 1 (4): 333–356. Дои:10.1007 / BF00133571.

[EcologicalActiveVision-4] а ^б Огнибене, Дмитрий; Бальдассаре, Джанлука (2015). «Экологически активное видение: четыре биоинспектированных принципа интеграции снизу вверх и адаптивного внимания сверху вниз, протестированные с помощью простого робота с камерой». IEEE Transactions по автономному умственному развитию. 7: 3–25. Дои:10.1109 / TAMD.2014.2341351.

[denzlertracking-5] Дензлер; Зобель; Ниманн (2003). "Информационно-теоретический выбор фокусного расстояния для активного отслеживания 3D-объекта в реальном времени". Труды Девятой международной конференции IEEE по компьютерному зрению. С. 400–407 т.1. CiteSeerX 10.1.1.122.1594. Дои:10.1109 / ICCV.2003.1238372. ISBN 978-0-7695-1950-0. S2CID 17622133.

[6] Ривлин, Эхуд; Ротштейн, Эктор (2000). «Управление камерой для активного зрения: фовеальное зрение, плавное отслеживание и саккада». Международный журнал компьютерного зрения. 39 (2): 81–96. Дои:10.1023 / А: 1008166825510.

[tatler-7] а ^б Tatler, B.W .; Hayhoe, M. M .; Land, M. F .; Баллард, Д. Х. (2011). «Управление глазами при естественном зрении: переосмысление значимости». Журнал видения. 11 (5): 5. Дои:10.1167/11.5.5. ЧВК 3134223. PMID 21622729.

[Findlay-8] а ^б Финдли, Дж. М. и Гилкрист, И. Д. Активное зрение, Психология взгляда и видения Oxford University Press, 2003 г.

[9] Тистарелли, М .; Сандини, Г. (1993). «О преимуществах полярного и лог-полярного картирования для прямой оценки времени воздействия оптического потока». IEEE Transactions по анализу шаблонов и машинному анализу. 15 (4): 401–410. CiteSeerX 10.1.1.49.9595. Дои:10.1109/34.206959.

[10] Вальтер, Дирк; Рутисхаузер, Ули; Кох, Кристоф; Перона, Пьетро (2005). «Выборочное визуальное внимание позволяет изучать и распознавать несколько объектов в загроможденных сценах» (PDF). Компьютерное зрение и понимание изображений. 100 (1–2): 41–63. CiteSeerX 10.1.1.110.976. Дои:10.1016 / j.cviu.2004.09.004.

[11] Larochelle, H .; Хинтон, Г. (6 декабря 2010 г.). «Обучение сочетанию фовеальных проблесков с машиной Больцмана третьего порядка» (PDF). Материалы 23-й Международной конференции по системам обработки нейронной информации.. 1. С. 1243–1251.

[12] Багданов, А.Д .; Дель Бимбо, А .; Нунциати, В. (2006). «Повышение доказательного качества изображений наблюдения за счет активного отслеживания лиц». 18-я Международная конференция по распознаванию образов (ICPR'06). С. 1200–1203. Дои:10.1109 / ICPR.2006.700. ISBN 978-0-7695-2521-1.

[Haj,_M._2011-13] а ^б ^c Аль-Хадж, Мурад; Фернандес, Карлес; Xiong, Zhanwu; Уэрта, Иван; Гонсалес, Хорди; Рока, Ксавьер (2011). «За пределами статической камеры: проблемы и тенденции активного зрения». Визуальный анализ людей. С. 11–30. Дои:10.1007/978-0-85729-997-0_2. ISBN 978-0-85729-996-3.

[Bellotto,_N._2012-14] а ^б Беллотто, Никола; Бенфолд, Бен; Харланд, Ханно; Нагель, Ханс-Хельмут; Пирло, Никола; Рид, Ян; Соммерлейд, Эрик; Чжао, Чуань (2012). «Когнитивное визуальное слежение и управление камерой» (PDF). Компьютерное зрение и понимание изображений. 116 (3): 457–471. Дои:10.1016 / j.cviu.2011.09.011.

[15] Папаниколопулос, Николаос Панайотис (1992). Контролируемое активное зрение (Кандидатская диссертация). Университет Карнеги Меллон.

[16] Мак, Лин Чи; Фурукава, Томонари; Уитти, Марк (2008). «Система локализации внутреннего винтокрылого MAV с использованием светодиодов, установленных на лопастях». Обзор датчика. 28 (2): 125–131. Дои:10.1108/02602280810856688.

[17] Нанесение на карту больших петель с помощью одной ручной камеры.LA Клементе, AJ Davison, ID Reid, J Neira, JD Tardós - Робототехника: наука и системы, 2007

[18] Демирис, Яннис; Хадхури, Бассам (2006). «Иерархические внимательные множественные модели для исполнения и распознавания действий». Робототехника и автономные системы. 54 (5): 361–369. CiteSeerX 10.1.1.226.5282. Дои:10.1016 / j.robot.2006.02.003.

[19] На пути к активному признанию событий Д. Огнибене, Ю. Демирис 23-я Международная совместная конференция по искусственному интеллекту (IJCAI13)

[20] ttp://www.surrey.ac.uk/eng/research/mechatronics/robots/Activities/ActiveVision/activevis.html В архиве 17 августа 2007 г. Wayback Machine

[21] Земля, Майкл Ф. (2006). «Движение глаз и контроль действий в повседневной жизни» (PDF). Прогресс в исследованиях сетчатки и глаз. 25 (3): 296–324. Дои:10.1016 / j.preteyeres.2006.01.002. PMID 16516530.

[22] Лунгарелла, Макс; Sporns, Олаф (2006). «Отображение информационного потока в сенсомоторных сетях». PLOS вычислительная биология. 2 (10): e144. Bibcode:2006PLSCB ... 2..144L. Дои:10.1371 / journal.pcbi.0020144. ЧВК 1626158. PMID 17069456.

[23] Verschure, Paul F. M. J .; Фогтлин, Томас; Дуглас, Родни Дж. (2003). «Экологически опосредованная синергия между восприятием и поведением мобильных роботов». Природа. 425 (6958): 620–624. Bibcode:2003Натура.425..620В. Дои:10.1038 / природа02024. PMID 14534588.

[24] Smith, C.E .; Папаниколопулос, Н.П .; Брандт, С.А. (1994). «Применение управляемой системы активного зрения к робототехническим и транспортным задачам». Труды семинара IEEE 1994 г. по приложениям компьютерного зрения. С. 213–220. CiteSeerX 10.1.1.40.3470. Дои:10.1109 / ACV.1994.341311. ISBN 978-0-8186-6410-6.

[Karasev,_P._2293-25] а ^б Карасев, Петр; Колесов, Иван; Чуды, Кароль; Танненбаум, Аллен; Мюллер, Грант; Ксерогей, Джон (2011). «Интерактивная сегментация МРТ с управляемым активным зрением». 2011 50-я конференция IEEE по решениям и контролю и Европейская конференция по контролю. С. 2293–2298. Дои:10.1109 / CDC.2011.6161453. ISBN 978-1-61284-801-3. ЧВК 3935399. PMID 24584213.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]