Комбинаторная теория игр - Combinatorial game theory

Математики играют Конане на семинаре по комбинаторной теории игр

Комбинаторная теория игр (CGT) является ветвью математика и теоретическая информатика это обычно изучает последовательные игры с идеальная информация. Исследование в основном ограничивалось двумя игроками. игры у которых есть позиция в котором игроки по очереди меняются определенным образом или движется для достижения определенного выигрышного состояния. CGT традиционно не изучается азартные игры или те, которые используют несовершенную или неполную информацию, отдавая предпочтение играм, которые предлагают идеальная информация в котором состояние игры и набор доступных ходов всегда известны обоим игрокам.[1] Однако по мере развития математических методов количество видов игр, которые можно математически проанализировать, расширяется, поэтому границы поля постоянно меняются.[2] Ученые обычно определяют, что они подразумевают под «игрой» в начале статьи, и эти определения часто различаются, поскольку они специфичны для анализируемой игры и не предназначены для представления всего объема области.

Комбинаторные игры включают в себя известные игры, такие как шахматы, шашки, и Идти, которые считаются нетривиальными, и крестики-нолики, который считается тривиальным в том смысле, что «легко решить». Некоторые комбинаторные игры также могут иметь неограниченный игровая площадка, например бесконечные шахматы. В CGT ходы в этих и других играх представлены в виде игровое дерево.

Комбинаторные игры также включают в себя комбинаторные головоломки для одного игрока, такие как Судоку, и автоматы без игроков, такие как Игра жизни Конвея, (хотя в самом строгом определении, можно сказать, что «игры» требуют более одного участника, отсюда и обозначения «головоломка» и «автомат».[3])

Теория игры в целом включает в себя азартные игры, игры с несовершенным знанием и игры, в которых игроки могут двигаться одновременно, и они, как правило, представляют собой ситуации принятия решений в реальной жизни.

CGT имеет другой акцент, чем «традиционная» или «экономическая» теория игр, которая изначально была разработана для изучения игр с простой комбинаторной структурой, но с элементами случайности (хотя она также рассматривает последовательные ходы, см. обширная игра ). По сути, CGT предоставил новые методы для анализа деревьев игр, например, используя сюрреалистические числа, которые являются подклассом всех игр с идеальной информацией для двух игроков.[3] Тип игр, изучаемый CGT, также интересен искусственный интеллект, особенно для автоматизированное планирование и составление графиков. В CGT уделялось меньше внимания уточнению практических алгоритмы поиска (такой как альфа – бета обрезка эвристика включена в большинство учебников по искусственному интеллекту), но больший упор делается на описательные теоретические результаты (например, меры сложность игры или доказательства существования оптимального решения без обязательного указания алгоритма, например аргумент о краже стратегии ).

Важным понятием CGT является понятие решенная игра. Например, крестики-нолики считается решенной игрой, так как можно доказать, что любая игра приведет к ничьей, если оба игрока будут играть оптимально. Получить аналогичные результаты для игр с богатой комбинаторной структурой сложно. Например, в 2007 году было объявлено, что шашки был слабо решено - оптимальная игра обеих сторон также ведет к ничьей - но этот результат компьютерное доказательство.[4] Другие игры в реальном мире в большинстве своем слишком сложны, чтобы их можно было провести полноценный анализ сегодня, хотя теория в последнее время добилась некоторых успехов в анализе эндшпилей го. Применение CGT к позиция пытается определить оптимальную последовательность ходов для обоих игроков, пока игра не закончится, и тем самым найти оптимальный ход в любой позиции. На практике этот процесс чрезвычайно труден, если игра не очень проста.

Может быть полезно провести различие между комбинаторными «математическими играми», интересными в первую очередь математикам и ученым для размышлений и решений, и комбинаторными «играми», интересными для населения в целом как формой развлечения и соревнований.[5] Однако некоторые игры попадают в обе категории. Ним, например, это игровая игра, которая послужила основой CGT, и одна из первых компьютерных игр.[6] Крестики-нолики до сих пор используются для обучения основным принципам игры. AI дизайн для Информатика студенты.

История

ВКТ возникла в связи с теорией беспристрастные игры, в котором любая игра, доступная одному игроку, должна быть доступна и другому. Одна из таких игр ним, который можно решить полностью. Ним - это беспристрастная игра для двух игроков, и нормальные условия игры, что означает, что игрок, который не может двигаться, проигрывает. В 1930-е гг. Теорема Спрага – Гранди показали, что все беспристрастные игры эквивалентны куче нимов, тем самым показывая, что в играх, рассматриваемых в комбинаторный уровень, на котором важны подробные стратегии, а не только вознаграждения.

В 1960-е гг. Элвин Р. Берлекамп, Джон Х. Конвей и Ричард К. Гай совместно представил теорию партизанская игра, в котором ослаблено требование о том, чтобы игра, доступная одному игроку, была доступна обоим. Их результаты опубликованы в их книге. Выигрышные способы для ваших математических игр в 1982 году. Однако первой работой, опубликованной на эту тему, была книга Конвея 1976 года. О числах и играх, также известный как ONAG, который ввел концепцию сюрреалистические числа и обобщение на игры. О числах и играх также был плодом сотрудничества Берлекампа, Конвея и Гая.

Комбинаторные игры обычно, по соглашению, принимают форму, в которой один игрок выигрывает, когда у другого не остается ходов. Любую конечную игру с двумя возможными результатами легко преобразовать в эквивалентную там, где применяется это соглашение. Одним из наиболее важных понятий в теории комбинаторных игр является концепция суммы двух игр, которая представляет собой игру, в которой каждый игрок может выбрать ход либо в одной игре, либо в другой в любой момент игры, и игрок выигрывает. когда у его соперника нет хода ни в одной из игр. Такой способ объединения игр приводит к богатой и мощной математической структуре.

Джон Конвей заявляет в ONAG, что вдохновение для теории партизанских игр было основано на его наблюдении за игрой в идти эндшпиль, который часто можно разложить на суммы более простых эндшпилей, изолированных друг от друга в разных частях доски.

Примеры

Вводный текст Пути победы представил большое количество игр, но следующие были использованы в качестве мотивирующих примеров для вводной теории:

  • Синий – Красный Hackenbush - На конечном уровне эта партизанская комбинаторная игра позволяет строить игры, значения которых диадические рациональные числа. На бесконечном уровне он позволяет конструировать все реальные ценности, а также множество бесконечных, которые попадают в класс сюрреалистические числа.
  • Синий – Красный – Зеленый Hackenbush - Позволяет использовать дополнительные игровые значения, которые не являются числами в традиционном смысле, например, звезда.
  • Жабы и лягушки - Допускает различные игровые значения. В отличие от большинства других игр, позиция легко представляется короткой строкой символов.
  • Властный - Различные интересные игры, такие как горячие игры, появляются как позиции в Доминирование, потому что иногда есть стимул двигаться, а иногда нет. Это позволяет обсуждать игровые температура.
  • Ним - An беспристрастная игра. Это позволяет построить ловцы. (Его также можно рассматривать как особый случай сине-красно-зеленого хакенбуша только для зеленого.)

Классическая игра Идти оказал влияние на раннюю комбинаторную теорию игр, и впоследствии Берлекамп и Вулф разработали эндшпиль и температура теория для него (см. ссылки). Вооружившись этим, они смогли построить вероятные позиции в эндшпиле Го, из которых они могли дать опытным игрокам Го выбор стороны, а затем победить их в любом случае.

Другая игра, изучаемая в контексте комбинаторной теории игр, - это шахматы. В 1953 г. Алан Тьюринг писал об игре: «Если можно совершенно недвусмысленно объяснить на английском языке, с помощью математических символов, если требуется, как должны выполняться вычисления, то всегда можно запрограммировать любой цифровой компьютер на выполнение этих вычислений при условии хранения емкость адекватная. "[7] В статье 1950 г. Клод Шеннон оценили нижнюю границу сложность дерева игр шахмат быть 10120, а сегодня это называется Число Шеннона.[8] Шахматы остаются нерешенными, хотя обширные исследования, включая работу с использованием суперкомпьютеров, позволили создать шахматный эндшпиль. столы, который показывает результат идеальной игры для всех финальных игр с семью или менее фигурами. Бесконечные шахматы имеет даже большую комбинаторную сложность, чем шахматы (если только не изучаются только ограниченные эндшпиты или составные позиции с небольшим количеством фигур).

Обзор

Игра, в простейшем виде, представляет собой список возможных "ходов", которые два игрока называют оставили и верно, могу сделать. Игровая позиция, полученная в результате любого хода, может считаться другой игрой. Эта идея рассматривать игры с точки зрения их возможных переходов в другие игры приводит к рекурсивный математическое определение игр, которое является стандартным в комбинаторной теории игр. В этом определении каждая игра имеет обозначение {L | R}. L - это набор игровых позиций, в которые может перемещаться левый игрок, и R - набор игровых позиций, в которые может перемещаться правый игрок; каждая позиция в L и R определяется как игра с использованием одинаковых обозначений.

С помощью Властный Например, пометьте каждое из шестнадцати квадратов на доске четыре на четыре буквой A1 для крайнего левого верхнего квадрата, C2 для третьего поля слева во втором ряду сверху и так далее. Мы используем, например, (D3, D4) для обозначения игровой позиции, в которой вертикальное домино было размещено в правом нижнем углу. Тогда начальная позиция может быть описана в обозначениях комбинаторной теории игр как

В стандартной игре Cross-Cram игроки чередуют ходы, но это чередование неявно обрабатывается определениями комбинаторной теории игр, а не кодируется внутри игровых состояний.

20x20square.png20x20square.png
20x20square.png

Вышеупомянутая игра описывает сценарий, в котором каждому игроку остается только один ход, и если любой из игроков сделает этот ход, он побеждает. (Нерелевантный открытый квадрат в C3 был опущен на диаграмме.) {|} В списке ходов каждого игрока (соответствующий единственному оставшемуся квадрату после хода) называется нулевая игра, и может быть сокращено до 0. В нулевой игре ни один из игроков не имеет правильных ходов; таким образом, игрок, чья очередь наступает при нулевой игре, автоматически проигрывает.

Тип игры на диаграмме выше также имеет простое название; это называется звездная игра, которое также можно обозначать как ∗. В игре со звездами единственный допустимый ход ведет к нулевой игре, что означает, что тот, кто выпадет во время игры со звездами, автоматически выигрывает.

Дополнительный тип игры, которого нет в Domineering, - это шаткий игра, в которой допустимый ход оставили или же верно - это игра, которая затем может вернуться к первой игре. Шашки, например, становится зацикленным, когда одна из фигур продвигается по службе, так как тогда она может бесконечно перемещаться между двумя или более квадратами. Игра, в которой таких ходов нет, называется без петель.

Аббревиатуры игр

Числа

Числа представляют количество свободных ходов или преимущество хода конкретного игрока. По соглашению положительные числа представляют преимущество для левых, а отрицательные числа представляют преимущество для правых. Они определяются рекурсивно, при этом 0 является базовым случаем.

0 = {|}
1 = {0|}, 2 = {1|}, 3 = {2|}
−1 = {|0}, −2 = {|−1}, −3 = {|−2}

В нулевая игра проигрыш для первого игрока.

Сумма числовых игр ведет себя как целые числа, например 3 + −2 = 1.

Звезда

Звезда, обозначаемый как ∗ или {0 | 0}, является выигрышем первого игрока, поскольку любой из игроков должен (если первый сделает ход в игре) перейти к нулевой игре и, следовательно, выиграть.

∗ + ∗ = 0, потому что первый игрок должен превратить одну копию ∗ в 0, а затем другой игрок должен будет превратить другую копию ∗ в 0; в этот момент проиграет первый игрок, поскольку 0 + 0 не допускает ходов.

Игра ∗ не является ни положительной, ни отрицательной; это и все другие игры, в которых выигрывает первый игрок (независимо от того, на какой стороне игрок), называются нечеткий с или же путать с 0; символически мы пишем ∗ || 0.

Вверх

Вверх, обозначаемый как ↑, - это позиция в комбинаторной теории игр.[9] В стандартных обозначениях ↑ = {0 | ∗}.

−↑ = ↓ (вниз)

Up строго положительно (↑> 0), но является бесконечно малый. Up определяется в Выигрышные способы для ваших математических игр.

Вниз

Вниз, обозначаемый ↓, - это позиция в комбинаторной теории игр.[9] В стандартных обозначениях ↓ = {∗ | 0}.

−↓ = ↑ (вверх)

Вниз строго отрицательно (↓ <0), но бесконечно малый. Вниз определяется в Выигрышные способы для ваших математических игр.

«Горячие» игры

Рассмотрим игру {1 | −1}. Оба хода в этой игре являются преимуществом для игрока, который их делает; поэтому игра считается «горячей»; оно больше любого числа меньше -1, меньше любого числа больше 1 и нечеткое с любым числом между ними. Он записывается как ± 1. Его можно добавлять к числам или умножать на положительные числа ожидаемым образом; например, 4 ± 1 = {5 | 3}.

Нимберы

An беспристрастная игра Это тот, в котором в каждой позиции игры одинаковые ходы доступны обоим игрокам. Например, Ним является беспристрастным, поскольку любой набор объектов, который может быть удален одним игроком, может быть удален другим. Тем не мение, властный не беспристрастно, потому что один игрок кладет горизонтальные домино, а другой - вертикальные. Точно так же шашки не беспристрастны, так как игроки владеют фишками разного цвета. Для любого порядковый номер можно определить беспристрастную игру, обобщающую Ним, в которой на каждом ходу любой игрок может заменить число любым меньшим порядковым номером; игры, определенные таким образом, известны как ловцы. В Теорема Спрага – Гранди заявляет, что любая беспристрастная игра эквивалентна ловлеру.

Самые "маленькие" нимберы - самые простые и наименьшие при обычном порядке порядковых номеров - это 0 и ∗.

Смотрите также

Примечания

  1. ^ Уроки в игре, стр. 3
  2. ^ Анализ покера Томасом С. Фергюссоном - это пример того, как CGT распространяется на игры, включающие элементы случая. Исследование NIM для трех игроков - это пример исследования, выходящего за рамки игр для двух игроков. Анализ партизанских игр Конвеем, Гаем и Берлекампом, возможно, является самым известным расширением возможностей CGT, выходящим за рамки изучения беспристрастных игр.
  3. ^ а б http://erikdemaine.org/papers/AlgGameTheory_GONC3/paper.pdf
  4. ^ Schaeffer, J .; Burch, N .; Bjornsson, Y .; Кишимото, А .; Muller, M .; Lake, R .; Lu, P .; Сутфен, С. (2007). «Шашки решены». Наука. 317 (5844): 1518–1522. Bibcode:2007Научный ... 317.1518S. CiteSeerX  10.1.1.95.5393. Дои:10.1126 / science.1144079. PMID  17641166.
  5. ^ Френкель, Авиезри (2009). «Комбинаторные игры: избранная библиография с кратким введением для гурманов». Игры без шанса 3. 56: 492.
  6. ^ Грант, Юджин Ф .; Ларднер, Рекс (2 августа 1952 г.). "Разговор о городе - это". Житель Нью-Йорка.
  7. ^ Алан Тьюринг. «Цифровые компьютеры в играх». Саутгемптонский университет и Королевский колледж Кембриджа. п. 2.
  8. ^ Клод Шеннон (1950). «Программирование компьютера для игры в шахматы» (PDF). Философский журнал. 41 (314): 4. Архивировано с оригинал (PDF) на 2010-07-06.
  9. ^ а б Э. Берлекамп; Дж. Х. Конвей; Р. Гай (1982). Выигрышные способы для ваших математических игр. я. Академическая пресса. ISBN  0-12-091101-9.
    Э. Берлекамп; Дж. Х. Конвей; Р. Гай (1982). Выигрышные способы для ваших математических игр. II. Академическая пресса. ISBN  0-12-091102-7.

Рекомендации

внешняя ссылка