Контрпример Витсенхаузенса - Witsenhausens counterexample - Wikipedia

Контрпример Витсенхаузена, показанный на рисунке ниже, является обманчиво простым проблема с игрушкой в децентрализованный стохастический контроль. Его сформулировал Ганс Витсенхаузен в 1968 г.^[1] Это контрпример к естественному догадка что можно обобщить ключевой результат централизованной линейно-квадратично-гауссовское управление системы - что в системе с линейной динамикой, гауссовским возмущением и квадратичной стоимостью аффинные (линейные) законы управления оптимальны - для децентрализованных систем. Витсенхаузен построил двухэтапную линейно-квадратичную гауссовскую систему, в которой два решения принимаются лицами, принимающими решения с децентрализованной информацией, и показал, что для этой системы существуют нелинейные законы управления, которые превосходят все линейные законы. Проблема поиска оптимального закона управления остается нерешенной.^[2]

Формулировка контрпримера

Формулировка контрпримера проста: два контроллера пытаются управлять системой, пытаясь приблизить состояние к нулю ровно за два временных шага. Первый контроллер наблюдает за начальным состоянием ${ displaystyle x_ {0}.}$ На входе указана стоимость ${ displaystyle u_ {1}}$ первого контроллера, а расходы на государство ${ displaystyle x_ {2}}$ после ввода второго контроллера. Вход ${ displaystyle u_ {2}}$ второго контроллера бесплатен, но основан на зашумленных наблюдениях ${ displaystyle y_ {1} = x_ {1} + z}$ государства ${ displaystyle x_ {1}}$ после первого входа контроллера. Второй контроллер не может связываться с первым контроллером и, следовательно, не может наблюдать исходное состояние. ${ displaystyle x_ {0}}$ или вход ${ displaystyle u_ {1}}$ первого контроллера. Таким образом, динамика системы

{ displaystyle x_ {1} = x_ {0} + u_ {1},}

{ displaystyle x_ {2} = x_ {1} -u_ {2},}

с уравнением наблюдения второго регулятора

{ displaystyle y_ {1} = x_ {1} + z.}

Цель состоит в том, чтобы минимизировать ожидаемое функция стоимости,

{ displaystyle k ^ {2} E [u_ {1} ^ {2}] + E [x_ {2} ^ {2}],}

где ожидание берется из случайности в начальном состоянии ${ displaystyle x_ {0}}$ и шум наблюдения ${ displaystyle z}$ , которые распространяются независимо. Шум наблюдения ${ displaystyle z}$ предполагается, что она распределена в Гауссовский образом, а распределение значения начального состояния ${ displaystyle x_ {0}}$ отличается в зависимости от конкретной версии проблемы.

Проблема в том, чтобы найти управляющие функции

{ displaystyle u_ {1} (x_ {0}) quad { text {и}} quad u_ {2} (y_ {1})}

которые дают, по крайней мере, такое же хорошее значение целевой функции, как и любая другая пара функций управления. Витсенхаузен показал, что оптимальные функции ${ displaystyle u_ {1} (x_ {0})}$ и ${ displaystyle u_ {2} (y_ {1})}$ не может быть линейным.

Конкретные результаты Витсенхаузена

Витсенхаузен получил следующие результаты:

Оптимум существует (теорема 1).
Оптимальный закон управления первого регулятора таков, что ${ displaystyle E (x_ {1}) = 0}$ (Лемма 9).
Дается точное решение для случая, когда оба регулятора должны быть линейными (лемма 11).
Если ${ displaystyle x_ {0}}$ имеет гауссово распределение, и если хотя бы один из контроллеров ограничен линейностью, то оптимально, чтобы оба контроллера были линейными (лемма 13).
Приведены точные нелинейные законы управления для случая, когда ${ displaystyle x_ {0}}$ имеет двухточечный симметричное распределение (Лемма 15).
Если ${ displaystyle x_ {0}}$ имеет гауссово распределение, для некоторых значений параметра предпочтения ${ displaystyle k}$ дается неоптимальное нелинейное решение для законов управления, которое дает более низкое значение для ожидаемой функции затрат, чем лучшая линейная пара законов управления (теорема 2).

Значимость проблемы

Контрпример находится на пересечении теория управления и теория информации. Проблема нахождения оптимального закона управления из-за своей сложности также привлекла внимание исследователей. теоретическая информатика сообщество. Важность проблемы была отражена на 47-й конференции IEEE по принятию решений и контролю (CDC) 2008 г., Канкун, Мексика,^[2] где целая сессия была посвящена пониманию контрпримера через 40 лет после того, как он был впервые сформулирован.

Проблема имеет концептуальное значение в децентрализованном управлении, потому что она показывает, что для контроллеров важно обмениваться данными^[3] друг с другом неявно, чтобы минимизировать стоимость. Это предполагает, что управляющие действия в децентрализованном управлении могут иметь двойную роль: управляющие и коммуникационные.

Сложность проблемы

Сложность проблемы объясняется тем, что информация второго контроллера зависит от решений первого контроллера.^[4] Варианты рассмотрены Укротитель Басар ^[5] показывают, что жесткость также обусловлена структурой индекса производительности и связью различных переменных решения. Также было показано, что проблемы духа контрпримера Витсенхаузена упрощаются, если задержка передачи вдоль внешнего канала, который соединяет контроллеры, меньше, чем Задержка распространения в проблеме. Однако этот результат требует, чтобы каналы были идеальными и мгновенными,^[6] и поэтому имеет ограниченную применимость. В практических ситуациях канал всегда несовершенен, и поэтому нельзя предположить, что проблемы децентрализованного управления просты при наличии внешних каналов.

Обоснование неудачи попыток дискретизации проблемы было найдено в литературе по информатике: Христос Пападимитриу и Джон Цициклис показал, что дискретная версия контрпримера НП-полный.^[7]

Попытки получить решение

Для решения контрпримера было предпринято несколько численных попыток. Ориентация на конкретный выбор параметров задачи ${ Displaystyle (к = 0,2, ; sigma _ {0} = 5)}$ , исследователи получили стратегии дискретизация и используя нейронные сети.^[8] Дальнейшие исследования (в частности, работы Ю-Чи Хо,^[9] и работы Ли, Мардена и Шамма ^[10]) немного улучшила стоимость при выборе того же параметра. Наиболее известные численные результаты для различных параметров, включая упомянутый ранее, получены с помощью алгоритма локального поиска, предложенного С.-Х. Ценг и А. Тан в 2017 году.^[11] Первые доказуемо приблизительно оптимальные стратегии появились в 2010 г. (Grover, Park, Sahai). ^[12] куда теория информации используется для понимания коммуникации в контрпримере. Оптимальное решение контрпримера остается открытой проблемой.

Рекомендации

^ Витсенхаузен, Ганс. «Контрпример в стохастическом оптимальном управлении». SIAM J. Control, Volume 6, Issue 1, pp. 131–147 (февраль 1968 г.)
^ ^а ^б Хо, Ю-Чи, "Обзор проблемы Витсенхаузена". Материалы 47-й конференции IEEE по решениям и контролю (CDC)2008. С. 1611–1613.
^ Миттеран и Сахаи. "Информация и контроль: снова о Витсенхаузене". Системы обучения, управления и гибридные системы, 1999, Springer.
^ Хо, Ю-Чи. «Теория командных решений и информационные структуры». Труды IEEE, Vol. 68, No 6, июнь 1980 г.
^ Басар, Укротитель. «Вариации на тему контрпримера Витценхаузена». 47-я конференция IEEE по решениям и контролю, Канкун, Мексика, 9–11 декабря 2008 г.
^ Rotkowitz, M .; Cogill, R .; Lall, S .; , "Простое условие выпуклости оптимального управления сетями с задержками", Решение и контроль, 2005 и 2005 гг. Европейская конференция по контролю. CDC-ECC '05. 44-я конференция IEEE по , pp. 6686–6691, 12–15 декабря 2005 г.
^ Христос Пападимитриу и Джон Цициклис. «Сложные проблемы теории управления». 24-я конференция IEEE по решениям и контролю, 1985
^ Баглитто, Паризини и Дзопполи. «Численное решение контрпримера Витсенхаузена с помощью аппроксимирующих сетей». IEEE Transactions по автоматическому контролю. 2001.
^ Ли, Лау и Хо. «Контрпример Витсенхаузена: иерархический поиск для невыпуклых задач оптимизации». IEEE Transactions по автоматическому контролю, 2001
^ Ли, Марден и Шамма. «Изучение подходов к контрпримеру Витсенхаузена с точки зрения потенциальных игр». Конференция IEEE по принятию решений и контролю, 2009.
^ Ценг и Тан. «Алгоритм локального поиска для контрпримера Витсенхаузена». Конференция IEEE по принятию решений и контролю, 2017.
^ Гровер, Сахаи и Парк. «Конечномерный контрпример Витсенхаузена». IEEE WiOpt 2010, семинар ConCom, Сеул, Корея.

[1] Витсенхаузен, Ганс. «Контрпример в стохастическом оптимальном управлении». SIAM J. Control, Volume 6, Issue 1, pp. 131–147 (февраль 1968 г.)

[Ho-2] а ^б Хо, Ю-Чи, "Обзор проблемы Витсенхаузена". Материалы 47-й конференции IEEE по решениям и контролю (CDC)2008. С. 1611–1613.

[3] Миттеран и Сахаи. "Информация и контроль: снова о Витсенхаузене". Системы обучения, управления и гибридные системы, 1999, Springer.

[4] Хо, Ю-Чи. «Теория командных решений и информационные структуры». Труды IEEE, Vol. 68, No 6, июнь 1980 г.

[5] Басар, Укротитель. «Вариации на тему контрпримера Витценхаузена». 47-я конференция IEEE по решениям и контролю, Канкун, Мексика, 9–11 декабря 2008 г.

[6] Rotkowitz, M .; Cogill, R .; Lall, S .; , "Простое условие выпуклости оптимального управления сетями с задержками", Решение и контроль, 2005 и 2005 гг. Европейская конференция по контролю. CDC-ECC '05. 44-я конференция IEEE по , pp. 6686–6691, 12–15 декабря 2005 г.

[7] Христос Пападимитриу и Джон Цициклис. «Сложные проблемы теории управления». 24-я конференция IEEE по решениям и контролю, 1985

[8] Баглитто, Паризини и Дзопполи. «Численное решение контрпримера Витсенхаузена с помощью аппроксимирующих сетей». IEEE Transactions по автоматическому контролю. 2001.

[9] Ли, Лау и Хо. «Контрпример Витсенхаузена: иерархический поиск для невыпуклых задач оптимизации». IEEE Transactions по автоматическому контролю, 2001

[10] Ли, Марден и Шамма. «Изучение подходов к контрпримеру Витсенхаузена с точки зрения потенциальных игр». Конференция IEEE по принятию решений и контролю, 2009.

[11] Ценг и Тан. «Алгоритм локального поиска для контрпримера Витсенхаузена». Конференция IEEE по принятию решений и контролю, 2017.

[12] Гровер, Сахаи и Парк. «Конечномерный контрпример Витсенхаузена». IEEE WiOpt 2010, семинар ConCom, Сеул, Корея.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]