Задача изменяемой площади - Modifiable areal unit problem

Пример искажения MAUP
Пример задачи модифицируемой площади и искажения расчетов скорости

В модифицируемая проблема единичной площади (МАУП) является источником статистическая погрешность что может существенно повлиять на результаты статистические проверки гипотез. MAUP влияет на результаты, когда измеряются точечные измерения пространственных явлений. агрегированный в районы, например, плотность населения или же показатели заболеваемости. На итоговые итоговые значения (например, итоги, скорости, пропорции, плотности) влияют как форма, так и масштаб единицы агрегирования.[1]

Например, данные переписи могут быть агрегированы по округам, переписным участкам, почтовым индексам, полицейским участкам или любому другому произвольному пространственному разделу. Таким образом, результаты агрегирования данных зависят от выбора картографом, какую «изменяемую единицу площади» использовать в своем анализе. Перепись хороплет карта Расчет плотности населения с использованием границ штатов приведет к совершенно другим результатам, чем карта, рассчитывающая плотность на основе границ округов. Кроме того, границы переписных районов также могут изменяться со временем,[2] это означает, что MAUP необходимо учитывать при сравнении прошлых данных с текущими данными.

Фон

Впервые проблема была обнаружена Гельке и Билем в 1934 году.[3] и позже подробно описан в известной статье Openshaw (1984) и в книге Арбиа (1988). В частности, Openshaw (1984) заметил, что «ареальные единицы (зональные объекты), используемые во многих географических исследованиях, произвольны, поддаются изменению и зависят от прихотей и фантазий того, кто занимается или делал агрегирование».[4] Проблема особенно очевидна, когда агрегированные данные используются для кластерного анализа для пространственная эпидемиология, пространственная статистика или же картографирование, в котором можно легко ошибиться, даже не осознавая этого. Многие области науки, особенно человеческая география склонны игнорировать MAUP при выводе статистических выводов на основе агрегированных данных.[нужна цитата ] МАУП тесно связан с темой экологическая ошибка и экологическая предвзятость (Арбия, 1988).

Экологическая ошибка, вызванная MAUP, была задокументирована как два отдельных эффекта, которые обычно возникают одновременно во время анализа агрегированных данных. Во-первых, эффект масштаба вызывает различия в статистических результатах между разными уровнями агрегации (радиальное расстояние). Следовательно, связь между переменными зависит от размера единиц площади, по которым сообщаются данные. Как правило, корреляция увеличивается с увеличением размера единицы площади. Эффект зоны описывает изменение статистики корреляции, вызванное перегруппировкой данных в различные конфигурации в одном масштабе (форма площади).

С 1930-х годов исследования обнаружили дополнительные вариации в статистических результатах из-за MAUP. Стандартные методы расчета дисперсии внутри группы и между группами не учитывают дополнительную дисперсию, наблюдаемую в исследованиях MAUP при изменении группировок. MAUP можно использовать в качестве методологии для расчета верхних и нижних пределов, а также средних параметров регрессии для нескольких наборов пространственных группировок. MAUP является критическим источником ошибок в пространственных исследованиях, будь то наблюдательные или экспериментальные. Таким образом, согласованность единиц измерения, особенно в контексте поперечного сечения временных рядов (TSCS), имеет важное значение. Кроме того, следует регулярно проводить проверки устойчивости единиц к альтернативной пространственной агрегации, чтобы уменьшить связанные с ней систематические ошибки в результирующих статистических оценках.

Предлагаемые решения

В литературе было сделано несколько предложений по снижению систематической ошибки агрегирования во время регрессивный анализ. Исследователь может скорректировать матрицу вариации-ковариации, используя выборки из данных индивидуального уровня.[5] В качестве альтернативы можно сосредоточиться на локальной пространственной регрессии, а не на глобальной регрессии. Исследователь также может попытаться разработать площадные единицы, чтобы максимизировать конкретный статистический результат.[4] Другие утверждали, что может быть трудно построить единый набор оптимальных единиц агрегирования для нескольких переменных, каждая из которых может проявлять нестационарность и пространственную автокорреляцию в пространстве по-разному. Другие предложили разработать статистику, изменяющуюся в разных масштабах предсказуемым образом, возможно, используя фрактальную размерность как масштабно-независимую меру пространственных отношений. Другие предложили байесовские иерархические модели в качестве общей методологии для объединения агрегированных данных и данных на индивидуальном уровне для экологического вывода.

Исследования MAUP, основанные на эмпирических данных, могут дать лишь ограниченное понимание из-за неспособности контролировать отношения между несколькими пространственными переменными. Моделирование данных необходимо для управления различными свойствами данных на индивидуальном уровне. Имитационные исследования показали, что пространственная поддержка переменных может повлиять на величину экологического искажения, вызванного агрегированием пространственных данных.[6]

Анализ чувствительности MAUP

Используя моделирование для одномерных данных, Ларсен выступал за использование коэффициента дисперсии для исследования влияния пространственной конфигурации, пространственной ассоциации и агрегирования данных.[7] Подробное описание изменения статистики из-за MAUP представлено Рейнольдсом, который демонстрирует важность пространственного расположения и пространственной автокорреляции значений данных.[8] Симуляционные эксперименты Рейнольда были расширены Свифтом, который начал серию из девяти упражнений с моделирования регрессионного анализа и пространственного тренда, а затем сосредоточился на теме MAUP в контексте пространственной эпидемиологии. Представлен метод анализа чувствительности MAUP, который демонстрирует, что MAUP не является проблемой.[6] MAUP можно использовать в качестве аналитического инструмента для понимания пространственной неоднородности и пространственная автокорреляция.

Эта тема особенно важна, потому что в некоторых случаях агрегирование данных может скрыть сильную корреляция между переменными, из-за чего связь кажется слабой или даже отрицательной. И наоборот, MAUP может привести к тому, что случайные переменные появятся так, как будто существует значимая связь, а ее нет. Параметры многомерной регрессии более чувствительны к MAUP, чем коэффициенты корреляции. До тех пор, пока не будет найдено более аналитическое решение для MAUP, рекомендуется анализ пространственной чувствительности с использованием различных площадных единиц в качестве методологии для оценки неопределенности коэффициентов корреляции и регрессии из-за экологической предвзятости. Доступен пример моделирования и повторной агрегации данных с использованием библиотеки ArcPy.[9][10]

В транспортном планировании MAUP связан с зонированием анализа трафика (TAZ). Важной отправной точкой в ​​понимании проблем транспортного анализа является признание того, что пространственный анализ имеет некоторые ограничения, связанные с дискретизацией пространства. Среди них изменяемые территориальные единицы и граничные задачи прямо или косвенно связаны с планированием и анализом транспортировки через проектирование зоны анализа трафика - большинство транспортных исследований прямо или косвенно требуют определения ТАЗ. Модифицируемой границе и вопросам масштаба следует уделить особое внимание во время спецификации TAZ из-за влияния этих факторов на статистические и математические свойства пространственных паттернов (то есть проблема изменяемых единиц площади - MAUP). В исследованиях Вьегаса, Мартинеса и Сильвы (2009, 2009b)[10] Авторы предлагают метод, при котором результаты, полученные при изучении пространственных данных, не зависят от масштаба, а эффекты агрегирования неявны при выборе зональных границ. Определение зональных границ ТАЗ напрямую влияет на реальность и точность результатов, полученных с помощью моделей прогнозирования перевозок. В этой статье влияние MAUP на определение TAZ и модели спроса на перевозки измеряется и анализируется с использованием различных сеток (по размеру и месту происхождения). Этот анализ был разработан путем создания приложения, интегрированного в коммерческое программное обеспечение ГИС, и использования тематического исследования (Лиссабонский метрополитен) для проверки его реализуемости и производительности. Результаты показывают конфликт между статистической и географической точностью и их связь с потерей информации на этапе назначения трафика в моделях планирования транспортировки.[10]

Смотрите также

Общие темы

Конкретные приложения

Рекомендации

  1. ^ "MAUP | Определение - Словарь ГИС поддержки Esri". support.esri.com. Получено 2017-03-09.
  2. ^ География, Бюро переписи населения США. «Заметки об изменении географических границ». www.census.gov. Получено 2017-02-24.
  3. ^ Гельке и Биль 1934 г.
  4. ^ а б Опеншоу 1983, п. 3
  5. ^ Холт Д., Стил Д., Транмер М., Ригли Н. (1996). «Агрегация и экологические эффекты в географических данных». «Географический анализ» 28: 244 {261
  6. ^ а б Свифт, А., Лю, Л., и Убер, Дж. (2008) "Снижение систематической ошибки MAUP корреляционной статистики между качеством воды и заболеваниями желудочно-кишечного тракта". Компьютеры, окружающая среда и городские системы 32, 134–148
  7. ^ Ларсен, Дж. (2000). "Проблема изменяемой площади: проблема или источник пространственной информации?" Кандидатская диссертация, Университет штата Огайо.
  8. ^ Рейнольдс, Х. (1998). «Проблема изменяемой единицы площади: эмпирический анализ с помощью статистического моделирования». Кандидатская диссертация, Департамент географии Университета Торонто, http://www.badpets.net/Thesis
  9. ^ Свифт, А. (2017). «Моделирование данных картирования преступлений», https://app.box.com/s/a84w16x7hffljjvkhtlr72eisj4qiene
  10. ^ а б c Вьегас, Хосе Мануэль; Мартинес, Л. Мигель; Сильва, Элизабет А. (январь 2009 г.). «Влияние проблемы изменяемой единицы площади на определение зон анализа движения». Окружающая среда и планирование B: планирование и дизайн. 36 (4): 625–643. Дои:10.1068 / b34033. S2CID  54840846.

Источники

  • Арбия, Джузеппе (1988). Конфигурация пространственных данных для последующего статистического анализа региональных экономических и связанных с ними проблем.. Дордрехт: Kluwer Academic Publishers.
  • CC-BY icon.svg Эта статья содержит цитаты из Задача изменяемой площади в GIS Wiki, который доступен под Creative Commons Attribution 3.0 Unported (CC BY 3.0) лицензия.
  • Gehlke, C.E .; Биль, Кэтрин (март 1934 г.). «Определенное влияние группировки на величину коэффициента корреляции в материале переписного участка». Журнал Американской статистической ассоциации. 29 (185A): 169–170. Дои:10.2307/2277827. JSTOR  2277827.CS1 maint: ref = harv (связь)
  • Опеншоу, Стэн (1983). Задача модифицируемых площадных единиц. Norwick: Geo Books. ISBN  0860941345. OCLC  12052482.CS1 maint: ref = harv (связь)
  • Анвин, Д. Дж. (1996). «ГИС, пространственный анализ и пространственная статистика». Прогресс в человеческой географии. 20: 540–551.
  • Кресси, Н. (1996). «Смена опоры и проблема изменяемой площади». «Географические системы», 3: 159–180.
  • Вьегас Дж., Э.А. Сильва, Л. Мартинес (2009a). «Влияние проблемы изменяемой площади на определение зон анализа движения» «Окружающая среда и планирование B - планирование и дизайн», 36 (4): 625–643.
  • Вьегас Дж., Э.А. Сильва, Л. Мартинес (2009a). «Определение зоны анализа трафика: новая методология и алгоритм» «Транспорт». 36 (5): 6 ”, 36 (5): 6.

дальнейшее чтение