pages bg right
Posted by papulia on Октябрь 17, 2008


Принцип максимального гарантированного результата

Принцип максимального гарантированного результата
(МГР) – это один из самых общих принципов принятия решений в
условиях интервальной неопределенности. В соответствии с прин-
ципом МГР неопределенность устраняется введением предположе-
87
ния, что неопределенные параметры принимают наихудшие для
ЛПР значения.
Определения принципа МГР для очень широкого класса игр
можно найти в [21]. Приведем некоторые из них.
Пусть игровая ситуация с точки зрения i-го игрока определя-
ется вектором z = (yi, q, r), yi Î Ai, q Î Q, r Î W, и его выигрыш
Ki = Ki(z) зависит от ситуации. Пусть yi Î Ai – действие i-го игро-
ка, и на момент принятия игроком решения о выборе стратегии
ему известны значения параметров q Î Q. Об остальных пара-
метрах информации не ожидается. Тогда принцип МГР предлагает
использование, так называемой, гарантирующей стратегии.
Определение 20: Гарантирующая стратегия i-го игрока – это
стратегия, определяемая по формуле:
yi* ( ) Arg my aAx[mr in Ki ( yi , , r)]
i i
q q
Î ÎW
Î .
Другими словами, для того, чтобы найти гарантирующую
стратегию i-го игрока, необходимо при фиксированных известных
параметрах q найти минимум функции выигрыша по неизвестным
параметрам r Î W, а затем максимизировать результат миними-
зации выбором действия yi. Стратегия ) (θ y*i , на которой
достигается максимум, и будет гарантирующей.
Вектор ( ) (θ y*i )i Î N гарантирующих стратегий игроков назы-
вается максиминным равновесием.
Неизвестные параметры могут иметь очень широкое содер-
жательное наполнение: от информации о действиях других игро-
ков, о виде их целевых функций, до информации о правилах игры.
Рассмотрим с этой точки зрения игру с неполной информацией.
Пусть на момент принятия решения каждому игроку известен
его тип ri Î Wi, неизвестны типы других игроков rj Î Wj (j ¹ i) и их
стратегии. Если Ki(y1, …, yn, r1, …, rn) – функция выигрыша i-го
игрока, то его гарантирующей стратегией будет стратегия
( i ) Argmy aAx[y Am,irn i ( 1 ,..., n , 1 ,..., n )]
*i
y r K y y r r
iÎ i -iÎ -i -iÎW-i
Î , i Î N.
Можно заметить, что приведенное определение подходит и
для игр с полной информированностью – гарантирующей страте-
88
гией i-го игрока в игре с полной информированностью будет стра-
тегия
Arg max[ min ( 1 ,..., )]
*
yi y A y A Ki y yn
iÎ i -iÎ -i
Î .
Для существования гарантирующей стратегии достаточно
ограниченности функции выигрыша игрока и компактности
множеств стратегий Ai и множеств типов игроков Wi [21], поэтому
можно говорить, что гарантирующие стратегии существуют
«почти всегда».
Еще одним преимуществом МГР является то, что для вычис-
ления гарантирующей стратегии игрока i достаточно знать только
функцию его выигрыша, и не нужно знание функций выигрыша
других игроков.
Недостатком МГР является его чрезмерная пессимистичность.
МГР призывает игрока рассчитывать на наихудшее для него
поведение противников. Это оправданно в случае антагони-
стических игр, но, если игрок знает, что интересы противников
лишь ненамного отличаются от его интересов, предположение о
том, что рациональные противники будут выбирать наихудшее для
него действие, не всегда адекватно.

Нечто важное
FUEL ждет коллекционное  издание. FUEL ждет коллек... rating
Diablo III снова без LANa Diablo III снова бе... rating
Watchmen: The End is Nig 2 скоро увидит свет Watchmen: The End is Nig 2... rating
Негодование на полях Starcraft 2 Негодование н... rating
Случайное
Оставьте свой комментарий


Leave a Reply

You must be logged in to post a comment.