Распознавание визуальных объектов (тест на животных) - Visual object recognition (animal test)

Распознавание визуальных объектов относится к способности идентифицировать объекты в поле зрения на основе визуального ввода. Одной из важных отличительных черт визуального распознавания объектов является «неизменность объекта» или способность идентифицировать объекты при изменении подробного контекста, в котором просматриваются объекты, включая изменения освещения, позы объекта и контекста фона.[1]

Основные этапы распознавания объекта

Нейропсихологические данные подтверждают, что в процессе распознавания объектов можно выделить четыре стадии. [2][3][4] Этими этапами являются:

Этап 1 Обработка основных компонентов объекта, таких как цвет, глубина и форма.
2 этап Эти основные компоненты затем группируются на основе сходства, предоставляя информацию об отдельных краях визуальной формы. Впоследствии фигура сегрегация может иметь место.
3 этап Визуальное представление сопоставляется со структурными описаниями в памяти.
4 этап Семантические атрибуты применяются к визуальному представлению, обеспечивая смысл и тем самым узнавание.

На этих этапах выполняются более конкретные процессы для завершения различных компонентов обработки. Кроме того, в других существующих моделях предложены интегративные иерархии (сверху вниз и снизу вверх), а также параллельная обработка, в отличие от этой общей иерархии снизу вверх.

Иерархическая обработка распознавания

Обработка визуального распознавания обычно рассматривается как восходящая иерархия, в которой информация обрабатывается последовательно с возрастающей сложностью. Во время этого процесса корковые процессоры нижнего уровня, такие как первичная зрительная кора, находятся в нижней части иерархии. Корковые процессоры более высокого уровня, такие как нижневисочная кора (IT), находятся наверху, где облегчается визуальное распознавание.[5] Широко признанная восходящая иерархическая теория - это описание Джеймса Дикарло «Распутывание». [6] посредством чего каждый этап иерархически организованного вентрального зрительного пути выполняет операции по постепенному преобразованию представлений объектов в легко извлекаемый формат. Напротив, все более популярной теорией обработки распознавания является нисходящая обработка. Одна модель, предложенная Моше Бар (2003), описывает «сокращенный» метод, при котором ранние визуальные входы отправляются, частично анализируются, из ранней зрительной коры головного мозга в префронтальная кора (PFC). Возможные интерпретации грубого визуального ввода генерируются в PFC и затем отправляются в нижневисочная кора (ИТ) впоследствии активируют соответствующие представления объектов, которые затем включаются в более медленный восходящий процесс. Этот «ярлык» предназначен для минимизации количества представлений объектов, необходимых для сопоставления, тем самым облегчая распознавание объектов.[5] Исследования поражений подтвердили это предложение с выводами о более медленном времени ответа для людей с поражениями ПФК, предполагая использование только восходящей обработки.[7]

Постоянство объектов и теории распознавания объектов

Важным аспектом распознавания объектов является постоянство объекта: способность распознавать объект в различных условиях просмотра. Эти различные условия включают ориентацию объекта, освещение и изменчивость объекта (размер, цвет и другие различия внутри категорий). Чтобы зрительная система могла добиться постоянства объекта, она должна уметь извлекать общность в описании объекта с разных точек зрения и описаний сетчатки глаза. [9] Участники, которые выполняли задачи по классификации и распознаванию во время воздействия функционального магнитного поля, обнаружили увеличение кровотока, указывающее на активацию в определенных областях мозга. Задача категоризации заключалась в том, что участники размещали объекты из канонических или необычных видов как внутренние, так и внешние. Задача распознавания происходит путем представления участникам изображений, которые они просматривали ранее. Половина этих изображений была в той же ориентации, что и ранее, а другая половина была представлена ​​в противоположной точке зрения. Области мозга, участвующие в умственном вращении, такие как вентральный и дорсальный зрительные пути и префронтальная кора, показали наибольшее увеличение кровотока во время этих задач, демонстрируя, что они имеют решающее значение для способности рассматривать объекты с разных углов.[8] Было создано несколько теорий, чтобы обеспечить понимание того, как постоянство объекта может быть достигнуто с целью распознавания объекта, включая теории, инвариантные к точке зрения, зависимые от точки зрения и теории множественных взглядов.

Теории, инвариантные к точке зрения

Теории, инвариантные к точкам зрения, предполагают, что распознавание объекта основано на структурной информации, такой как отдельные части, что позволяет распознаванию происходить независимо от точки зрения объекта. Соответственно, распознавание возможно с любой точки зрения, поскольку отдельные части объекта можно вращать, чтобы соответствовать любому конкретному виду. [10][нужна цитата ] Эта форма аналитического распознавания требует небольшого объема памяти, поскольку необходимо кодировать только структурные части, которые могут создавать множественные репрезентации объектов посредством взаимосвязи этих частей и умственного вращения [10].[нужна цитата ] Участникам исследования были представлены по одной кодировке для каждого из 24 предварительно выбранных объектов, а также пять изображений-заполнителей. Затем объекты были представлены в центральном поле зрения либо в той же, либо в другой ориентации, чем исходное изображение. Затем участников попросили назвать, были ли представлены такие же или разные виды этих объектов с ориентацией в глубину.[9] Затем такая же процедура была выполнена при представлении изображений в левом или правом поле зрения. Зависимость от точки обзора наблюдалась, когда тестовые изображения представлялись непосредственно правому полушарию, но не когда тестовые изображения представлялись непосредственно левому полушарию. Результаты подтверждают модель, согласно которой объекты хранятся способом, зависящим от точки обзора, поскольку результаты не зависели от того, можно ли восстановить тот же или другой набор деталей из видов с разной ориентацией.[9]

Трехмерное представление модели

Эта модель, предложенная Марром и Нишихарой ​​(1978), утверждает, что распознавание объекта достигается путем сопоставления представлений трехмерной модели, полученных из визуального объекта, с представлениями трехмерной модели, хранящимися в памяти как предписания вертикальной формы.[требуется разъяснение ][10] С помощью компьютерных программ и алгоритмов И Юнгфэн (2009) смог продемонстрировать способность человеческого мозга мысленно создавать трехмерные изображения, используя только двухмерные изображения, которые появляются на сетчатке. Их модель также демонстрирует высокую степень постоянства формы между 2D-изображениями, что позволяет распознавать 3D-изображение.[10] Трехмерные модельные представления, полученные от объекта, формируются путем определения вогнутостей объекта, которые разделяют стимул на отдельные части. Недавние исследования показывают, что область мозга, известная как каудальная интрапариетальная область (CIP), отвечает за сохранение наклона и наклона плоской поверхности, что позволяет распознавать вогнутость.[11] Розенбург и др. имплантировали обезьянам склеральную поисковую катушку для наблюдения за положением глаз при одновременной регистрации активации отдельных нейронов от нейронов внутри CIP. Во время эксперимента обезьяны сидели в 30 см от ЖК-экрана, на котором отображались визуальные стимулы. Признаки бинокулярного несоответствия отображались на экране путем визуализации стимулов в виде зелено-красных анаглифов, а кривые наклонного наклона находились в диапазоне от 0 до 330. Единственное испытание состояло из точки фиксации и затем предъявления стимула в течение 1 секунды. Затем регистрировали активацию нейронов с помощью хирургически введенных микроэлектродов. Эта активация отдельных нейронов для определенных вогнутостей объектов приводит к открытию, что каждая ось отдельной части объекта, содержащей вогнутость, находится в хранилищах памяти.[11] Идентификация главной оси объекта помогает в процессе нормализации посредством мысленного вращения, которое требуется, потому что в памяти хранится только каноническое описание объекта. Узнавание достигается, когда точка обзора наблюдаемого объекта мысленно поворачивается, чтобы соответствовать сохраненному каноническому описанию.[нужна цитата ]

Рис. 1. Это изображение, созданное на основе теории распознавания по компонентам Бидермана (1987), является примером того, как объекты могут быть разбиты на геоны.

Распознавание по компонентам

Расширение модели Марра и Нишихары, модель теория распознавания по компонентам, предложенный Бидерманом (1987), предлагает, чтобы визуальная информация, полученная от объекта, была разделена на простые геометрические компоненты, такие как блоки и цилиндры, также известные как "геоны "(геометрические ионы), а затем сопоставляются с наиболее похожим представлением объекта, которое хранится в памяти, чтобы обеспечить идентификацию объекта (см. рисунок 1).[12]

Теории, зависящие от точки зрения

Теории, зависящие от точки обзора, предполагают, что на распознавание объекта влияет точка обзора, с которой он виден, подразумевая, что объекты, видимые с новых точек обзора, снижают точность и скорость идентификации объекта.[13] Эта теория распознавания основана на более целостной системе, а не по частям, предполагая, что объекты хранятся в памяти с несколькими точками обзора и углами. Эта форма распознавания требует много памяти, так как каждая точка обзора должна быть сохранена. Точность распознавания также зависит от того, насколько знакома наблюдаемая точка зрения объекта.[14]

Теория множественных просмотров

Эта теория предполагает, что распознавание объектов лежит в континууме точек зрения, где каждая точка зрения задействована для разных типов распознавания. На одном полюсе этого континуума механизмы, зависящие от точки зрения, используются для внутрикатегорийной дискриминации, в то время как на другом полюсе механизмы, не зависящие от точки зрения, используются для категоризации объектов.[13]

Нейронные субстраты

альтернативный текст
Дорсальный поток показан зеленым, а нижний - фиолетовым.

Дорсальный и вентральный поток

Визуальную обработку объектов в мозге можно разделить на два пути обработки: спинной поток (как / где), которая простирается от зрительная кора к теменные доли, и брюшной поток (что), которое простирается от зрительная кора к нижневисочная кора (ЭТО). Существование этих двух отдельных путей обработки зрительной информации было впервые предложено Унгерлейдером и Мишкиным (1982), которые на основании своих исследований поражений предположили, что спинной поток участвует в обработке визуальной пространственной информации, такой как локализация объекта (где), и брюшной поток участвует в обработке опознавательной информации визуального объекта (что).[15] Начиная с этого первоначального предложения, в качестве альтернативы предлагалось, чтобы дорсальный путь был известен как путь 'Как', поскольку визуальная пространственная информация, обрабатываемая здесь, предоставляет нам информацию о том, как взаимодействовать с объектами,[16] В целях распознавания объектов нейронный фокус сосредоточен на брюшной поток.

Функциональная специализация вентрального потока

В рамках вентрального потока при исследованиях функциональной визуализации наблюдались различные области предполагаемой функциональной специализации. Области мозга, наиболее часто демонстрирующие функциональную специализацию, - это веретенообразная область лица (FFA), который показывает повышенную активацию лиц по сравнению с объектами, область парагиппокампа (PPA) для сцен и объектов, экстрастриантная область тела (EBA) для частей тела по сравнению с объектами, MT + / V5 для движущихся стимулов по сравнению со статическими стимулами и латеральный затылочный комплекс (LOC) для различимых форм по сравнению с зашифрованными стимулами.[17] (Смотрите также: Нейронная обработка отдельных категорий объектов )

Структурная обработка: латеральный затылочный комплекс.

Боковой затылочный комплекс (LOC) оказался особенно важным для распознавания объектов на структурном уровне восприятия. В мероприятии, связанном с фМРТ В ходе исследования, посвященного адаптации нейронов, активируемых при визуальной обработке объектов, было обнаружено, что подобие формы объекта необходимо для последующей адаптации в LOC, но не специфические особенности объекта, такие как края и контуры. Это предполагает, что активация в LOC представляет информацию о форме объекта более высокого уровня, а не простые характеристики объекта.[18] В родственной фМРТ исследования, активация LOC, которая произошла независимо от визуальных сигналов представленного объекта, таких как движение, текстура или контраст яркости, предполагает, что различные визуальные сигналы низкого уровня, используемые для определения объекта, сходятся в «областях, связанных с объектом», чтобы помогают в процессе восприятия и распознавания.[19] Ни одна из упомянутых сведений о форме объекта более высокого уровня, похоже, не дает семантический информация об объекте, поскольку LOC показывает реакцию нейронов на различные формы, включая незнакомые абстрактные объекты.[20]

Дальнейшие эксперименты показали, что LOC состоит из иерархической системы избирательности формы, указывающей на большую избирательную активацию в задний области для фрагментов объектов, тогда как передний области показывают большую активацию для полных или частичных объектов.[21] Это согласуется с предыдущими исследованиями, которые предполагают иерархическое представление в вентральной височной коре, где обработка первичных признаков происходит в задний регионов и интеграция этих функций в единый и значимый объект происходит в передний регионы.[22]

Семантическая обработка

Семантические ассоциации позволяют быстрее распознавать объекты. Когда объект ранее был связан с каким-то семантическим значением, люди более склонны правильно идентифицировать объект. Исследования показали, что семантические ассоциации позволяют гораздо быстрее распознать объект, даже когда объект рассматривается под разными углами. Когда объекты рассматриваются под все более отклоняющимися углами от традиционной плоскости зрения, объекты, которые имеют заученные семантические ассоциации, имеют меньшее время отклика по сравнению с объектами, которые не имеют никаких усвоенных семантических ассоциаций.[23] Таким образом, когда распознавание объектов становится все труднее, семантические ассоциации позволяют сделать распознавание намного проще. Точно так же субъект может быть обучен распознавать объект, наблюдая за действием, которое просто связано с целевым объектом. Это показывает, что у объектов есть набор сенсорных, моторных и семантических ассоциаций, которые позволяют человеку правильно распознать объект.[24] Это подтверждает утверждение о том, что мозг использует несколько частей, пытаясь точно идентифицировать объект.

Через информацию, предоставленную нейропсихологический пациентов, диссоциация обработки распознавания была идентифицирована между структурной и семантический обработка структурной, цветовой и ассоциативной информации может быть выборочно нарушена. В одном ПЭТ исследования, области, вовлеченные в ассоциативную семантическую обработку, включают левую переднюю верхнюю / верхнююсредняя височная извилина и слева височный полюс сравнительно со структурной и цветовой информацией, а также с правильным височный полюс только в сравнении с задачами цветового решения.[25] Эти результаты указывают на то, что хранимые перцептивные знания и семантические знания включают отдельные области коры в распознавании объектов, а также указывают на полушарные различия во временных областях.

Исследования также предоставили доказательства того, что визуальная семантическая информация сходится в веретенообразных извилинах нижних височных долей. В исследовании, сравнивавшем семантическое знание категория в отличие от атрибутов, было обнаружено, что они играют разные роли в том, как они способствуют узнаванию. Для категориальных сравнений боковые области веретенообразная извилина были активированы живыми объектами, по сравнению с неживыми объектами, которые активировали медиальные области. Для сравнения атрибутов было обнаружено, что правая веретенообразная извилина была активирована глобальной формой по сравнению с локальными деталями, которые активировали левую веретеновидную извилину. Эти результаты предполагают, что тип категории объекта определяет, какая область веретенообразной извилины активируется для обработки семантического распознавания, тогда как атрибуты объекта определяют активацию в левой или правой веретенообразной извилине в зависимости от того, обрабатывается ли глобальная форма или локальные детали. .[26]

Кроме того, было предложено, чтобы активация в передний области веретеновидных извилин свидетельствуют об успешном распознавании.[27] Однако было обнаружено, что уровни активации зависят от семантической значимости объекта. Термин семантическая релевантность здесь означает «меру вклада семантических характеристик в ядро значение концепции ".[28] Результаты показали, что объекты с высокой семантической релевантностью, такие как артефакты, повышает активацию по сравнению с объектами с низкой семантической релевантностью, такими как естественные объекты.[28] Это связано с предполагаемой повышенной сложностью различения природных объектов, поскольку они имеют очень похожие структурные свойства, что затрудняет их идентификацию по сравнению с артефактами.[27] Следовательно, чем легче объект идентифицировать, тем больше вероятность, что он будет успешно распознан.

Еще одно условие, влияющее на успешное распознавание объектов, - это: контекстное содействие. Считается, что во время задач распознавания объекта объект сопровождается «контекстным фреймом», который предлагает семантическую информацию о типичном контексте объекта.[29] Было обнаружено, что, когда объект находится вне контекста, производительность распознавания объекта затрудняется из-за более медленного времени отклика и большей неточности по сравнению с задачами распознавания, когда объект находился в соответствующем контексте.[29] На основе результатов исследования с использованием фМРТ, было высказано предположение, что в мозгу существует «контекстная сеть» для контекстно связанных объектов, активность которых в основном обнаруживается в Парагиппокампальная кора (PHC) и Retrosplenial Complex (RSC).[30] В рамках PHC деятельность в Площадь Парагиппокампа (PPA) предпочтительнее сцен, чем объектов; тем не менее, было высказано предположение, что деятельность в ПМСП для одиночных объектов в задачах контекстной помощи может быть связана с последующим размышлением о пространственной сцене, в которой объект контекстуально представлен. Дальнейшие эксперименты показали, что активация была обнаружена как для непространственного, так и для пространственного контекстов в ПМСП, хотя активация из непространственных контекстов была ограничена передний ПМСП и задний PHC для пространственного контекста.[30]

Признание памяти

Когда кто-то видит объект, они знают, что это за объект, потому что видели его в прошлом; это память распознавания. На нашу способность распознавать объект влияют не только отклонения вентрального (какого) потока зрительного пути, но и то, как объект нам преподносят. Одной из примечательных характеристик памяти визуального распознавания является ее замечательная способность: даже после просмотра тысяч изображений в единичных испытаниях люди с высокой точностью выполняют последующие тесты памяти и запоминают значительные детали об изображениях, которые они видели. [31]

Контекст

Контекст обеспечивает гораздо большую точность распознавания объектов. Когда идентифицируемый объект размыт, точность распознавания намного выше, если объект помещен в знакомый контекст. В дополнение к этому, даже незнакомый контекст позволяет более точно распознавать объект по сравнению с объектом, показываемым изолированно.[32] Это можно объяснить тем фактом, что объекты обычно видны в некоторых настройках, а не вообще без них. Когда установка, в которой находится объект, знакома зрителю, становится намного проще определить, что это за объект. Хотя контекст не требуется для правильного распознавания, он является частью ассоциации, которая создается с определенным объектом.

Контекст становится особенно важным при распознавании лиц или эмоций. Когда лицевые эмоции представлены без какого-либо контекста, способность, с которой кто-то может точно описать показываемую эмоцию, значительно ниже, чем при задании контекста. Это явление остается верным для всех возрастных групп и культур, что означает, что контекст важен для точного определения эмоций лица у всех людей.[33]

Знакомство

Знакомство - это механизм, не зависящий от контекста, в том смысле, что то, что человек узнает, кажется знакомым, не тратя время на попытки выяснить, в каком контексте он знает объект.[34] Вентро-латеральная область лобной доли участвует в кодировании памяти во время случайного обучения, а затем в поддержании и извлечении семантических воспоминаний.[34]Знакомство может вызывать процессы восприятия, отличные от процессов восприятия незнакомых объектов, что означает, что наше восприятие конечного числа знакомых объектов уникально.[35] Отклонения от типичных точек зрения и контекстов могут повлиять на эффективность, благодаря которой объект распознается наиболее эффективно.[35] Было обнаружено, что не только знакомые объекты распознаются более эффективно, если смотреть со знакомой точки зрения в противоположность незнакомой, но также этот принцип применим к новым объектам. Это приводит к мысли, что представления объектов в нашем мозгу организованы более знакомым образом, чем объекты, наблюдаемые в окружающей среде.[35] Распознавание во многом определяется не только формой объекта и / или видами, но и динамической информацией.[36] Знакомство может улучшить восприятие динамических точечных световых индикаторов, движущихся объектов, пола лиц и распознавания лиц.[35]

Воспоминание

Воспоминание имеет много общего со знакомым; однако это зависит от контекста и требует конкретной информации из запрошенного инцидента.[34]

Обесценения

Потеря распознавания объекта называется визуальный объект агнозия. Есть две широкие категории визуальный объект агнозия: апперцептивный и ассоциативный. Когда объектная агнозия возникает из-за поражения в доминантном полушарии, часто возникает глубокое связанное с этим языковое нарушение, включая потерю значения слова.

Последствия поражения вентральной струи

Распознавание объектов - сложная задача, в которой задействованы несколько различных областей мозга, а не одна. Если одна область повреждена, распознавание объекта может быть затруднено. Основная область распознавания объектов находится в височная доля. Например, было обнаружено, что поражения периринальная кора у крыс вызывает нарушение распознавания объектов, особенно с увеличением неоднозначности признаков.[37] Неонатальные аспирационные поражения миндалевидного комплекса у обезьян, по-видимому, приводили к большей потере объектной памяти, чем ранние поражения гиппокампа. Однако у взрослых обезьян нарушение объектной памяти лучше объясняется повреждением периринальных и энторинальная кора чем повреждение ядер миндалины.[38] Комбинированные поражения миндалевидного гормона (A + H) у крыс ухудшали производительность при выполнении задачи распознавания объектов, когда интервалы удерживания были увеличены за пределы 0 с и когда тестовые стимулы повторялись в течение сеанса. Повреждение миндалина или гиппокамп не влияет на распознавание объектов, тогда как повреждение A + H вызывает явные недостатки.[39] В задаче распознавания объектов уровень дискриминации был значительно ниже в электролитических поражениях бледного шара (часть базальный ганглий ) у крыс по сравнению с Substantia-Innominata / Ventral Pallidum, что, в свою очередь, было хуже по сравнению с контрольной и средней перегородкой / вертикальной диагональной полосой группы Broca; однако только globus pallidus не различает новые и знакомые объекты.[40] Эти поражения повреждают вентральный (какой) путь визуальной обработки объектов в головном мозге.

Визуальные агнозии

Агнозия является редким явлением и может быть результатом инсульта, деменции, травмы головы, инфекции головного мозга или наследственной.[41]Апперцептивная агнозия дефицит восприятия объектов, создающий неспособность понимать значение объектов.[34]Так же, ассоциативная зрительная агнозия это неумение понимать значение предметов; однако на этот раз дефицит в семантической памяти.[34] Обе эти агнозии могут влиять на путь к распознаванию объектов, как и теория зрения Марра. В частности, в отличие от апперцептивной агнозии, пациенты с ассоциативной агнозией более успешны в задачах рисования, копирования и сопоставления; однако эти пациенты демонстрируют, что они могут воспринимать, но не узнавать.[41]Интегративная агнозия (подтип ассоциативной агнозии) - это неспособность объединить отдельные части в единое изображение.[34] При этих типах агнозии происходит повреждение вентрального (что) потока пути визуальной обработки. Агнозия ориентации объекта - это неспособность определить ориентацию объекта, несмотря на адекватное распознавание объекта.[34] При этом типе агнозии происходит повреждение дорсального (где) потока пути визуальной обработки. Это может повлиять на распознавание объектов с точки зрения знакомства, и тем более с точки зрения незнакомых объектов и точек обзора. Трудности с распознаванием лиц можно объяснить тем, что прозопагнозия. Кто-то с прозопагнозией не может идентифицировать лицо, но все же способен распознавать возраст, пол и эмоциональное выражение.[41] Область мозга, определяющая распознавание лиц это веретенообразная область лица. Прозопагнозию также можно разделить на апперцептивный и ассоциативный подтипы. Распознавание отдельных стульев, машин, животных также может быть нарушено; следовательно, эти объекты обладают схожими характеристиками восприятия с лицом, которое распознается в веретенообразной области лица.[41]

Болезнь Альцгеймера

Различие между категорией и атрибутом в семантическом представлении может информировать нашу способность оценивать семантическую функцию при старении и болезненных состояниях, влияющих на семантическую память, например: Болезнь Альцгеймера (ОБЪЯВЛЕНИЕ).[42] Из-за дефицита семантической памяти люди, страдающие болезнью Альцгеймера, испытывают трудности с распознаванием объектов как семантическая память как известно, используется для получения информации для именования и категоризации объектов.[43] Фактически, активно обсуждается вопрос о том, отражает ли дефицит семантической памяти в AD потерю семантических знаний для определенных категорий и понятий или потерю знаний о перцептивных характеристиках и атрибутах.[42]

Смотрите также

использованная литература

  1. ^ Ульман, С. (1996) High Level Vision, MIT Press
  2. ^ Хамфрис Г., Прайс К., Риддок Дж. (1999). «От объектов к именам: подход когнитивной нейробиологии». Психологические исследования. 62 (2–3): 118–130. Дои:10.1007 / s004260050046. PMID  10472198.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  3. ^ Риддок, М., и Хамфрис, Г. (2001). Распознавание объектов. В Б. Раппе (ред.), Справочник по когнитивной нейропсихологии. Хоув: Psychology Press.
  4. ^ Уорд, Дж. (2006). Руководство для студентов по когнитивной неврологии. Нью-Йорк: Психология Пресс.
  5. ^ а б Бар M (2003). «Кортикальный механизм для запуска нисходящего облегчения в распознавании визуальных объектов». Журнал когнитивной неврологии. 15 (4): 600–609. CiteSeerX  10.1.1.296.3039. Дои:10.1162/089892903321662976. PMID  12803970.
  6. ^ ДиКарло Дж. Дж., Кокс Д. Д. (2007). «Распутывание инвариантных объектов распознавания». Тенденции Cogn Sci. 11 (8): 333–41. Дои:10.1016 / j.tics.2007.06.010.
  7. ^ Ричер Ф., Буле С. (1999). «Фронтальные поражения и колебания при подготовке к ответу» (PDF). Мозг и познание. 40 (1): 234–238. Дои:10.1006 / brcg.1998.1067. PMID  10373286. Архивировано из оригинал (PDF) на 2018-01-18. Получено 2018-01-17.
  8. ^ Шенден, Халин (2008). «Там, где зрение встречается с памятью: префронтально-задние сети для постоянства визуального объекта во время категоризации и распознавания». Нейропсихология и невролог. 18 (7): 1695–1711.
  9. ^ а б Бургунд, Э. Дарси; Марсолек, Чад Дж. (2000). «Распознавание объектов с инвариантной и зависимой от точки зрения точки зрения в диссоциативных нейронных подсистемах». Психономический бюллетень и обзор. 7 (3): 480–489. Дои:10.3758 / BF03214360. ISSN  1069-9384. PMID  11082854.
  10. ^ а б Юньфэн, И (2009). «Вычислительная модель, восстанавливающая трехмерную форму объекта из одного двухмерного представления сетчатки глаза». Исследование зрения. 49 (9): 979–991. Дои:10.1016 / j.visres.2008.05.013. PMID  18621410.
  11. ^ а б Розенберг, Ари (2013). «Визуальное представление трехмерной ориентации объекта в теменной коре». Журнал неврологии. 33 (49): 19352–19361. Дои:10.1523 / jneurosci.3174-13.2013. ЧВК  3850047. PMID  24305830.
  12. ^ Бидерман I (1987). «Распознавание по компонентам: теория понимания человеческого образа». Психологический обзор. 94 (2): 115–147. CiteSeerX  10.1.1.132.8548. Дои:10.1037 / 0033-295x.94.2.115. PMID  3575582.
  13. ^ а б Тарр М., Бултхофф Х. (1995). «Лучше ли распознавание человеческих объектов описывать с помощью структурных описаний геона или с помощью множественных представлений? Комментарий на Biederman and Gerhardstein (1993)». Журнал экспериментальной психологии: человеческое восприятие и производительность. 21 (6): 1494–1505. Дои:10.1037/0096-1523.21.6.1494.
  14. ^ Петерсон М.А. и Родс Г. (ред.). (2003). Восприятие лиц, предметов и сцен: аналитические и целостные процессы. Нью-Йорк: Издательство Оксфордского университета.
  15. ^ Унгерлейдер Л.Г., Мишкин М., 1982. Две корковые зрительные системы. In: Ingle, D.J., Goodale, M.A., Mansfield, R.J.W. (Ред.), Анализ визуального поведения. InMIT Press, Кембридж, стр. 549–586.
  16. ^ Гудейл М., Милнер А. (1992). «Отдельные визуальные пути восприятия и действия». Тенденции в неврологии. 15 (1): 20–25. CiteSeerX  10.1.1.207.6873. Дои:10.1016/0166-2236(92)90344-8. PMID  1374953.
  17. ^ Спиридон М., Фишл Б., Канвишер Н. (2006). «Расположение и пространственный профиль категорийных регионов в экстрастриальной коре головного мозга человека». Картирование человеческого мозга. 27 (1): 77–89. Дои:10.1002 / hbm.20169. ЧВК  3264054. PMID  15966002.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  18. ^ Курци З., Канвишер Н. (2001). «Представление формы воспринимаемого объекта латеральным затылочным комплексом человека». Наука. 293 (5534): 1506–1509. Bibcode:2001Научный ... 293,1506K. Дои:10.1126 / science.1061133. PMID  11520991.
  19. ^ Гриль-Спектор К .; Кушнир Т .; Эдельман С .; Ицхак Ю .; Малах Р. (1998). «Cue-инвариантная активация в объектных областях затылочной доли человека». Нейрон. 21 (1): 191–202. Дои:10.1016 / s0896-6273 (00) 80526-7. PMID  9697863.
  20. ^ Malach R .; Реппас Дж .; Benson R .; Kwong K .; Jiang H .; Kennedy W .; и другие. (1995). «Объектная активность, выявленная с помощью функциональной магнитно-резонансной томографии в затылочной коре человека». Труды Национальной академии наук США. 92 (18): 8135–8139. Bibcode:1995ПНАС ... 92.8135М. Дои:10.1073 / пнас.92.18.8135. ЧВК  41110. PMID  7667258.
  21. ^ Гриль-Спектор К., Курци З., Канвишер Н. (2001). «Латеральный затылочный комплекс и его роль в распознавании объектов». Исследование зрения. 42 (10–11): 1409–1422. Дои:10.1016 / с0042-6989 (01) 00073-6. PMID  11322983.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  22. ^ Унгерлейдер Л.Г., Мишкин М., 1982. Две корковые зрительные системы. In: Ingle, D.J., Goodale, M.A., Mansfield, R.J.W. (Ред.), Анализ визуального поведения. InMIT Press, Кембридж, стр. 549–586.
  23. ^ Коллинз и Курби (2013). «Концептуальное знание снижает зависимость точки зрения при распознавании визуальных объектов». Визуальное познание. 21 (8): 945–960. Дои:10.1080/13506285.2013.836138.
  24. ^ Хельбиг; и другие. (2009). «Наблюдение за действием может способствовать распознаванию визуальных объектов». Exp Brain Res. 200: 251–8. Дои:10.1007 / s00221-009-1953-8. ЧВК  2820217. PMID  19669130.
  25. ^ Келленбах М., Ховиус М., Паттерсон К. (2005). «ПЭТ-исследование визуальных и семантических знаний об объектах». Кора. 41 (2): 121–132. Дои:10.1016 / s0010-9452 (08) 70887-6. PMID  15714895.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  26. ^ Wierenga C., Perlstein W., Benjamin M., Leonard C., Rothi L., Conway T .; и другие. (2009). «Нейронные основы идентификации объекта: функциональная магнитно-резонансная томография свидетельствует о том, что категория и визуальные атрибуты способствуют семантическому знанию». Журнал Международного нейропсихологического общества. 15 (2): 169–181. Дои:10,1017 / с 1355617709090468. PMID  19232155.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  27. ^ а б Герлах C (2009). «Категория-специфичность в распознавании визуальных объектов». Познание. 111 (3): 281–301. Дои:10.1016 / j.cognition.2009.02.005. PMID  19324331.
  28. ^ а б Мечелли А., Сартори Г., Орланди П., Прайс К. (2006). «Семантическая релевантность объясняет эффекты категории в медиальных веретенообразных извилинах». NeuroImage. 30 (3): 992–1002. Дои:10.1016 / j.neuroimage.2005.10.017. PMID  16343950.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  29. ^ а б Бар М., Ульман С. (1996). «Пространственный контекст в узнавании». Восприятие. 25 (3): 343–352. Дои:10.1068 / p250343. PMID  8804097.
  30. ^ а б Бар М., Аминов Э. (2003). «Корковый анализ визуального контекста». Нейрон. 38 (2): 347–358. Дои:10.1016 / s0896-6273 (03) 00167-3. PMID  12718867.
  31. ^ Брэди Т.Ф., Конкл Т., Альварес Г.А., Олива А. (2008). «Зрительная долговременная память имеет огромную емкость для хранения деталей объекта». Proc Natl Acad Sci USA. 105 (38): 14325–9. Bibcode:2008ПНАС..10514325Б. Дои:10.1073 / pnas.0803390105. ЧВК  2533687. PMID  18787113.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  32. ^ Баренгольц; и другие. (2014). «Количественная оценка роли контекста в распознавании визуальных объектов». Визуальное познание. 22: 30–56. Дои:10.1080/13506285.2013.865694.
  33. ^ Теурель; и другие. (2016). «Интеграция визуальной контекстной информации в распознавание эмоций лица у детей от 5 до 15 лет». Журнал экспериментальной детской психологии. 150: 252–271. Дои:10.1016 / j.jecp.2016.06.004. PMID  27367301.
  34. ^ а б c d е ж г Уорд, Дж. (2006). Руководство для студентов по когнитивной неврологии. Нью-Йорк: Psychology Press
  35. ^ а б c d Бултхофф И., Ньюэлл Ф. (2006). Роль знакомства в распознавании статических и динамических объектов. Прогресс в исследованиях мозга. 154. С. 315–325. Дои:10.1016 / S0079-6123 (06) 54017-8. HDL:21.11116 / 0000-0004-9C5A-8. ISBN  9780444529664. PMID  17010720.
  36. ^ Вуонг, К., и Тарр, М. (2004). Направление вращения влияет на распознавание объекта
  37. ^ Норман Г., Икотт М. (2004). «Нарушение распознавания объектов с увеличивающимся уровнем неоднозначности признаков у крыс с поражениями периринальной коры». Поведенческие исследования мозга. 148 (1–2): 79–91. Дои:10.1016 / s0166-4328 (03) 00176-1. PMID  14684250.
  38. ^ Бачевалье, Дж., Борегар, М., и Альварадо, М.С. (1999). Долгосрочные эффекты неонатального повреждения образования гиппокампа и миндалевидного комплекса на различение объектов и распознавание объектов у макак-резусов. Поведенческая неврология, 113.
  39. ^ Агглетон Дж. П., Блиндт Х. С., Роулинз Дж. Н. П. (1989). «Влияние миндалевидных тел и поражений миндалины-гиппокампа на распознавание объектов и пространственную рабочую память у крыс». Поведенческая неврология. 103 (5): 962–974. Дои:10.1037/0735-7044.103.5.962.CS1 maint: несколько имен: список авторов (ссылка на сайт)
  40. ^ Эннасер А. (1998). «Влияние повреждений субстанции Innominata / вентрального паллидума, бледного шара и медиальной перегородки на производительность крыс в задачах распознавания объектов и радиального лабиринта: лечение физостигмином и амфетамином». Фармакологические исследования. 38 (4): 251–263. Дои:10.1006 / фразы.1998.0361. PMID  9774488.
  41. ^ а б c d Бауэр, Р. М. (2006). Агнозии. Округ Колумбия, США: Американская психологическая ассоциация: Вашингтон.
  42. ^ а б Хаджилоу Б. Б., Сделано Д. Дж. (2007). «Доказательства диссоциации структурных и семантических знаний при деменции типа Альцгеймера (DAT)». Нейропсихология. 45 (4): 810–816. Дои:10.1016 / j.neuropsychologia.2006.08.008. PMID  17034821.
  43. ^ Лаату С., Джайкка Х., Портин Р., Ринне Дж. (2003). «Распознавание визуальных объектов на ранних этапах болезни Альцгеймера: дефицит семантической обработки». Acta Neurologica Scandinavica. 108 (2): 82–89. Дои:10.1034 / j.1600-0404.2003.00097.x. PMID  12859283.CS1 maint: несколько имен: список авторов (ссылка на сайт)