Проблема канадского путешественника - Canadian traveller problem

В Информатика и теория графов, то Проблема канадского путешественника (ОСАГО) является обобщением проблема кратчайшего пути к графам, которые частично наблюдаемый. Другими словами, граф раскрывается, пока он исследуется, и исследовательские ребра оплачиваются, даже если они не вносят вклад в окончательный путь.

Этот проблема оптимизации был представлен Христос Пападимитриу и Михалис Яннакакис в 1989 г. и с тех пор изучается ряд вариантов задачи. Название предположительно происходит из разговоров авторов, узнавших о затруднении Канадский водители: едут по сети городов со снегопадом, случайным образом блокируя дороги. Стохастическая версия, в которой каждое ребро связано с вероятностью независимого нахождения в графе, получила значительное внимание в исследование операций под названием «Стохастическая проблема кратчайшего пути с обращением» (SSPPR).

Описание проблемы

Для данного случая есть несколько возможностей, или реализации, как может выглядеть скрытый граф. Для данного экземпляра описание того, как лучше всего следовать ему, называется политика. Задача CTP - вычислить ожидаемую стоимость оптимальных политик. Вычислить фактическое описание оптимальной политики может оказаться более сложной задачей.

Учитывая экземпляр и политику для этого экземпляра, каждая реализация производит свое собственное (детерминированное) блуждание по графу. Обратите внимание, что прогулка не обязательно дорожка поскольку лучшая стратегия может заключаться, например, в посещении каждой вершины цикла и возвращении к началу. Это отличается от проблема кратчайшего пути (со строго положительными весами), где повторение прогулки означает, что существует лучшее решение.

Варианты

В первую очередь существует пять параметров, различающих количество вариантов задачи канадского путешественника. Первый параметр - это то, как оценивать обход, произведенный политикой для данного экземпляра и реализации. В задаче стохастического кратчайшего пути с регрессом цель состоит в том, чтобы просто минимизировать стоимость обхода (определяемую как сумма по всем ребрам стоимости ребра, умноженная на количество раз, когда это ребро было взято). Задача проблемы канадского путешественника - минимизировать конкурентное соотношение прогулки; то есть, чтобы минимизировать количество раз, в течение которого произведенный обход является кратчайшим путем в реализации.

Второй параметр - как оценить политику в отношении различных реализаций, согласующихся с рассматриваемым экземпляром. В проблеме канадского путешественника желают изучить худший случай а в ССППР средний случай. Для анализа среднего случая необходимо, кроме того, указать априори распределение по реализациям.

Третий параметр ограничен стохастическими версиями и касается того, какие предположения мы можем сделать относительно распределения реализаций и того, как это распределение представлено во входных данных. В стохастической задаче канадского путешественника и в задаче стохастического кратчайшего пути, не зависящей от ребра (i-SSPPR), каждое неопределенное ребро (или стоимость) связано с вероятностью присутствия в реализации, и событие, что ребро находится в графе, является независимым. из которых другие ребра находятся в реализации. Несмотря на то, что это значительное упрощение, проблема все еще остается #П -жесткий. Другой вариант - не делать никаких предположений о распределении, но требовать, чтобы каждая реализация с ненулевой вероятностью была явно указана (например, «Вероятность 0,1 набора ребер {{3,4}, {1,2}}, вероятность 0,2 из. .. »). Это называется проблемой кратчайшего пути распределения (d-SSPPR или R-SSPPR) и является NP-полной. Первый вариант сложнее второго, потому что первый может представить в логарифмическом пространстве некоторые распределения, которые последний представляет в линейном пространстве.

Четвертый и последний параметр - это то, как график меняется со временем. В CTP и SSPPR реализация фиксирована, но не известна. В задаче стохастического кратчайшего пути с обращением и сбросами или в задаче ожидаемого кратчайшего пути новая реализация выбирается из распределения после каждого шага, предпринимаемого политикой. Эту проблему можно решить за полиномиальное время, сведя ее к марковскому процессу принятия решений с полиномиальным горизонтом. Марковское обобщение, в котором реализация графа может повлиять на следующую реализацию, как известно, намного сложнее.

Дополнительным параметром является то, как при реализации открываются новые знания. В традиционных вариантах CTP агент раскрывает точный вес (или статус) ребра при достижении соседней вершины. Недавно был предложен новый вариант, в котором агент также имеет возможность выполнять дистанционное зондирование из любого места на реализации. В этом варианте задача состоит в том, чтобы минимизировать транспортные расходы плюс затраты на зондирование.

Формальное определение

Мы определяем вариант, изученный в статье от 1989 года. То есть цель состоит в том, чтобы минимизировать коэффициент конкуренции в худшем случае. Необходимо начать с введения определенных терминов.

Рассмотрим данный граф и семейство неориентированных графов, которые можно построить, добавив одно или несколько ребер из данного набора. Формально пусть ${displaystyle {mathcal {G}} (V, E, F) = {(V, E + F ') | F'subseteq F}, Ecap F = emptyset}$ где мы думаем о E как ребра, которые должны быть в графе и F как ребра, которые могут быть в графе. Мы говорим что ${displaystyle Gin {mathcal {G}} (V, E, F)}$ это реализация семейства графов. Кроме того, пусть W - соответствующая матрица затрат, где ${displaystyle w_ {ij}}$ стоимость выхода из вершины я к вершине j, предполагая, что это ребро находится в реализации.

Для любой вершины v в V, мы называем ${displaystyle E_ {B} (v, V)}$ его ребра, падающие относительно набора ребер B на V. Кроме того, для реализации ${displaystyle Gin {mathcal {G}} (V, E, F)}$ , позволять ${displaystyle d_ {B} (s, t)}$ - стоимость кратчайшего пути в графе из s к т. Это называется автономной проблемой, потому что алгоритм для такой проблемы будет иметь полную информацию о графе.

Мы говорим, что стратегия ${displaystyle pi}$ для навигации по такому графику - это отображение из ${displaystyle ({mathcal {P}} (E), {mathcal {P}} (F), V)}$ к ${displaystyle V}$ , где ${displaystyle {mathcal {P}} (X)}$ обозначает powerset из Икс. Определяем стоимость ${displaystyle c (pi, B)}$ стратегии ${displaystyle pi}$ в отношении конкретной реализации ${displaystyle G = (V, B)}$ следующим образом.

Позволять ${displaystyle v_ {0} = s, E_ {0} = E}$ и ${displaystyle F_ {0} = F}$ .
За ${displaystyle i = 0,1,2, ...}$ $я = 0, 1, 2, ...$ , определять
- ${displaystyle E_ {i + 1} = E_ {i} чашка E_ {B} (v_ {i}, V)}$ ,
- ${displaystyle F_ {i + 1} = F_ {i} -E_ {F} (v_ {i}, V)}$ , и
- ${displaystyle v_ {i + 1} = pi (E_ {i + 1}, F_ {i + 1}, v_ {i})}$ .
Если существует Т такой, что ${displaystyle v_ {T} = t}$ , тогда ${displaystyle c (pi, B) = sum _ {i = 0} ^ {T-1} w_ {v_ {i}, v_ {i + 1}}}$ ; в противном случае пусть ${displaystyle c (pi, B) = infty}$ .

Другими словами, мы оцениваем политику на основе тех ребер, которые, как нам известно, находятся в графе ( ${displaystyle E_ {i}}$ ) и известные нам ребра могут быть в графе ( ${displaystyle F_ {i}}$ ). Когда мы делаем шаг в графе, нам становятся известны ребра, инцидентные нашему новому местоположению. Те ребра, которые есть в графе, добавляются к ${displaystyle E_ {i}}$ , и независимо от того, находятся ли ребра в графе или нет, они удаляются из множества неизвестных ребер, ${displaystyle F_ {i}}$ . Если цель никогда не достигается, мы говорим, что у нас бесконечная цена. Если цель достигнута, мы определяем стоимость обхода как сумму затрат всех пройденных ребер с мощностью.

Наконец, мы определяем проблему канадского путешественника.

Учитывая экземпляр CTP

{displaystyle (V, E, F, s, t, r)}

, решите, существует ли политика

{displaystyle pi}

так что для каждой реализации

{displaystyle (V, B) в {mathcal {G}} (V, E, F)}

, цена

{displaystyle c (pi, B)}

политики не более р раз оптимальное автономное,

{displaystyle d_ {B} (s, t)}

.

Пападимитриу и Яннакакис отметили, что это определяет игра для двух игроков, где игроки соревнуются за стоимость своих путей, а набор ребер выбирается вторым игроком (природой).

Сложность

В исходной статье анализировалась сложность проблемы и сообщалось, что она PSPACE-полный. Также было показано, что поиск оптимального пути в случае, когда каждое ребро имеет связанную вероятность нахождения в графе (i-SSPPR), легко выполнить с помощью PSPACE, но ♯P -сложная проблема.^[1] Устранить этот пробел было открытой проблемой, но с тех пор как направленная, так и неориентированная версии оказались трудными для PSPACE.^[2]

Направленный вариант стохастической задачи известен в исследование операций как стохастическая задача кратчайшего пути с регрессом.

Приложения

Говорят, что проблема имеет приложения в исследование операций, планирование перевозок, искусственный интеллект, машинное обучение, сети связи и маршрутизация. Исследован вариант задачи для навигации роботов с вероятностным распознаванием ориентиров.^[3]

Открытые проблемы

Несмотря на возраст проблемы и ее многочисленные потенциальные приложения, многие естественные вопросы все еще остаются открытыми. Есть ли приближение постоянного множителя или проблема APX -жесткий? I-SSPPR # P-complete? Остался без ответа еще более фундаментальный вопрос: существует ли размер полинома описание оптимальной политики, отложив на мгновение время, необходимое для вычисления описания?^[4]

Смотрите также

Примечания

^ Пападимитриу и Яннакакис, 1989, стр. 148
^ Фрид, Шимони, Бенбассат и Веннер, 2013 г.
^ Бриггс, Эми Дж .; Детвейлер, Каррик; Шарштейн, Даниэль (2004). «Ожидаемые кратчайшие пути для навигации роботов на основе ориентиров». «Международный журнал исследований робототехники». 23 (7–8): 717–718. CiteSeerX 10.1.1.648.3358. Дои:10.1177/0278364904045467.
^ Каргер и Николова, 2008, с. 1