Проблема канадского путешественника - Canadian traveller problem

В Информатика и теория графов, то Проблема канадского путешественника (ОСАГО) является обобщением проблема кратчайшего пути к графам, которые частично наблюдаемый. Другими словами, граф раскрывается, пока он исследуется, и исследовательские ребра оплачиваются, даже если они не вносят вклад в окончательный путь.

Этот проблема оптимизации был представлен Христос Пападимитриу и Михалис Яннакакис в 1989 г. и с тех пор изучается ряд вариантов задачи. Название предположительно происходит из разговоров авторов, узнавших о затруднении Канадский водители: едут по сети городов со снегопадом, случайным образом блокируя дороги. Стохастическая версия, в которой каждое ребро связано с вероятностью независимого нахождения в графе, получила значительное внимание в исследование операций под названием «Стохастическая проблема кратчайшего пути с обращением» (SSPPR).

Описание проблемы

Для данного случая есть несколько возможностей, или реализации, как может выглядеть скрытый граф. Для данного экземпляра описание того, как лучше всего следовать ему, называется политика. Задача CTP - вычислить ожидаемую стоимость оптимальных политик. Вычислить фактическое описание оптимальной политики может оказаться более сложной задачей.

Учитывая экземпляр и политику для этого экземпляра, каждая реализация производит свое собственное (детерминированное) блуждание по графу. Обратите внимание, что прогулка не обязательно дорожка поскольку лучшая стратегия может заключаться, например, в посещении каждой вершины цикла и возвращении к началу. Это отличается от проблема кратчайшего пути (со строго положительными весами), где повторение прогулки означает, что существует лучшее решение.

Варианты

В первую очередь существует пять параметров, различающих количество вариантов задачи канадского путешественника. Первый параметр - это то, как оценивать обход, произведенный политикой для данного экземпляра и реализации. В задаче стохастического кратчайшего пути с регрессом цель состоит в том, чтобы просто минимизировать стоимость обхода (определяемую как сумма по всем ребрам стоимости ребра, умноженная на количество раз, когда это ребро было взято). Задача проблемы канадского путешественника - минимизировать конкурентное соотношение прогулки; то есть, чтобы минимизировать количество раз, в течение которого произведенный обход является кратчайшим путем в реализации.

Второй параметр - как оценить политику в отношении различных реализаций, согласующихся с рассматриваемым экземпляром. В проблеме канадского путешественника желают изучить худший случай а в ССППР средний случай. Для анализа среднего случая необходимо, кроме того, указать априори распределение по реализациям.

Третий параметр ограничен стохастическими версиями и касается того, какие предположения мы можем сделать относительно распределения реализаций и того, как это распределение представлено во входных данных. В стохастической задаче канадского путешественника и в задаче стохастического кратчайшего пути, не зависящей от ребра (i-SSPPR), каждое неопределенное ребро (или стоимость) связано с вероятностью присутствия в реализации, и событие, что ребро находится в графе, является независимым. из которых другие ребра находятся в реализации. Несмотря на то, что это значительное упрощение, проблема все еще остается -жесткий. Другой вариант - не делать никаких предположений о распределении, но требовать, чтобы каждая реализация с ненулевой вероятностью была явно указана (например, «Вероятность 0,1 набора ребер {{3,4}, {1,2}}, вероятность 0,2 из. .. »). Это называется проблемой кратчайшего пути распределения (d-SSPPR или R-SSPPR) и является NP-полной. Первый вариант сложнее второго, потому что первый может представить в логарифмическом пространстве некоторые распределения, которые последний представляет в линейном пространстве.

Четвертый и последний параметр - это то, как график меняется со временем. В CTP и SSPPR реализация фиксирована, но не известна. В задаче стохастического кратчайшего пути с обращением и сбросами или в задаче ожидаемого кратчайшего пути новая реализация выбирается из распределения после каждого шага, предпринимаемого политикой. Эту проблему можно решить за полиномиальное время, сведя ее к марковскому процессу принятия решений с полиномиальным горизонтом. Марковское обобщение, в котором реализация графа может повлиять на следующую реализацию, как известно, намного сложнее.

Дополнительным параметром является то, как при реализации открываются новые знания. В традиционных вариантах CTP агент раскрывает точный вес (или статус) ребра при достижении соседней вершины. Недавно был предложен новый вариант, в котором агент также имеет возможность выполнять дистанционное зондирование из любого места на реализации. В этом варианте задача состоит в том, чтобы минимизировать транспортные расходы плюс затраты на зондирование.

Формальное определение

Мы определяем вариант, изученный в статье от 1989 года. То есть цель состоит в том, чтобы минимизировать коэффициент конкуренции в худшем случае. Необходимо начать с введения определенных терминов.

Рассмотрим данный граф и семейство неориентированных графов, которые можно построить, добавив одно или несколько ребер из данного набора. Формально пусть где мы думаем о E как ребра, которые должны быть в графе и F как ребра, которые могут быть в графе. Мы говорим что это реализация семейства графов. Кроме того, пусть W - соответствующая матрица затрат, где стоимость выхода из вершины я к вершине j, предполагая, что это ребро находится в реализации.

Для любой вершины v в V, мы называем его ребра, падающие относительно набора ребер B на V. Кроме того, для реализации , позволять - стоимость кратчайшего пути в графе из s к т. Это называется автономной проблемой, потому что алгоритм для такой проблемы будет иметь полную информацию о графе.

Мы говорим, что стратегия для навигации по такому графику - это отображение из к , где обозначает powerset из Икс. Определяем стоимость стратегии в отношении конкретной реализации следующим образом.

  • Позволять и .
  • За , определять
    • ,
    • , и
    • .
  • Если существует Т такой, что , тогда ; в противном случае пусть .

Другими словами, мы оцениваем политику на основе тех ребер, которые, как нам известно, находятся в графе () и известные нам ребра могут быть в графе (). Когда мы делаем шаг в графе, нам становятся известны ребра, инцидентные нашему новому местоположению. Те ребра, которые есть в графе, добавляются к , и независимо от того, находятся ли ребра в графе или нет, они удаляются из множества неизвестных ребер, . Если цель никогда не достигается, мы говорим, что у нас бесконечная цена. Если цель достигнута, мы определяем стоимость обхода как сумму затрат всех пройденных ребер с мощностью.

Наконец, мы определяем проблему канадского путешественника.

Учитывая экземпляр CTP , решите, существует ли политика так что для каждой реализации , цена политики не более р раз оптимальное автономное, .

Пападимитриу и Яннакакис отметили, что это определяет игра для двух игроков, где игроки соревнуются за стоимость своих путей, а набор ребер выбирается вторым игроком (природой).

Сложность

В исходной статье анализировалась сложность проблемы и сообщалось, что она PSPACE-полный. Также было показано, что поиск оптимального пути в случае, когда каждое ребро имеет связанную вероятность нахождения в графе (i-SSPPR), легко выполнить с помощью PSPACE, но ♯P -сложная проблема.[1] Устранить этот пробел было открытой проблемой, но с тех пор как направленная, так и неориентированная версии оказались трудными для PSPACE.[2]

Направленный вариант стохастической задачи известен в исследование операций как стохастическая задача кратчайшего пути с регрессом.

Приложения

Говорят, что проблема имеет приложения в исследование операций, планирование перевозок, искусственный интеллект, машинное обучение, сети связи и маршрутизация. Исследован вариант задачи для навигации роботов с вероятностным распознаванием ориентиров.[3]

Открытые проблемы

Несмотря на возраст проблемы и ее многочисленные потенциальные приложения, многие естественные вопросы все еще остаются открытыми. Есть ли приближение постоянного множителя или проблема APX -жесткий? I-SSPPR # P-complete? Остался без ответа еще более фундаментальный вопрос: существует ли размер полинома описание оптимальной политики, отложив на мгновение время, необходимое для вычисления описания?[4]

Смотрите также

Примечания

  1. ^ Пападимитриу и Яннакакис, 1989, стр. 148
  2. ^ Фрид, Шимони, Бенбассат и Веннер, 2013 г.
  3. ^ Бриггс, Эми Дж .; Детвейлер, Каррик; Шарштейн, Даниэль (2004). «Ожидаемые кратчайшие пути для навигации роботов на основе ориентиров». «Международный журнал исследований робототехники». 23 (7–8): 717–718. CiteSeerX  10.1.1.648.3358. Дои:10.1177/0278364904045467.
  4. ^ Каргер и Николова, 2008, с. 1

Рекомендации

  • C.H. Пападимитриу; М. Яннакакис (1989). «Кратчайшие пути без карты». Конспект лекций по информатике. Proc. 16-й ИКАЛП. 372. Springer-Verlag. С. 610–620.
  • Дрор Фрид; Соломон Эяль Шимони; Амит Бенбассат; Кенни Веннер (2013). «Сложность вариантов задач канадского путешественника». Теоретическая информатика. 487: 1–16. Дои:10.1016 / j.tcs.2013.03.016.
  • Дэвид Каргер; Евдокия Николова (2008). «Точные алгоритмы решения проблемы канадского путешественника на тропах и деревьях». Цитировать журнал требует | журнал = (Помогите)
  • Захи Бная; Ариэль Фельнер; Соломон Эяль Шимони (2009). «Проблема канадского путешественника с дистанционным зондированием». Цитировать журнал требует | журнал = (Помогите)