pages bg right
Posted by papulia on Октябрь 17, 2008


«Параметрическое» равновесие Нэша

Для того чтобы вычислить равновесие Нэша, исследователь
игры должен точно знать функции выигрыша игроков. В задачах
управления, однако, часто встречается ситуация, когда на момент
исследования игры функции выигрыша известны исследователю
игры не полностью. Эта ситуация характерна для механизмов
управления с сообщением информации [10, 64] (см. пример 2).
Неточную информацию о функциях выигрыша игроков при-
нято описывать с помощью понятия типа игрока. Рассмотрим
следующую игру n лиц, в которой каждый из игроков имеет неко-
торый тип ri Î Wi из множества Wi возможных типов данного иг-
рока i. Будем считать, что все множества типов Wi компактны,
i Î N. Функции выигрыша игроков Ki = Ki (x1,…xn , r1,…,rn ) зави-
82
сят как от действий xi Î Xi всех игроков, так и от их типов
ri Î Wi, i Î N.
Определение 18: Профилем типов игроков называется вектор
r = (r1, r2, …, rn) Î W = Õ
Î
W
i N
i .
Определение 19: Набор функций x* (r) = (x1* (r),…, x*n (r)) будем
называть равновесием Нэша35 (в чистых стратегиях) в игре с па-
раметрически заданными функциями выигрыша, если для каждо-
го фиксированного профиля r типов игроков для каждого игрока
iÎN и для всех его стратегий xi Î Xi, справедливо неравенство
Ki (x * (r), r) ³ Ki ( xi , x*-i (r), r) .
Пример 15. «Простая задача распределения ресурса».
Рассмотрим организационную систему, состоящую из центра
и двух агентов (игроков). Центру распределяет между игроками
ресурс, для чего собирает от них заявки si Î[0;1] (i = 1, 2) и вы-
дает каждому игроку ресурс по формуле
(11)
4
xi si s1 s2
= - + .
В этом механизме центр «недодает» игрокам ресурс относи-
тельно заявленных ими потребностей, причем, чем больше сооб-
щенная общая потребность в ресурсе 1 2 s + s , тем существеннее ста-
новится «недодача».
Игроки имеют типы ri Î [0; 1]. Функции выигрыша игроков
зависят от полученного ими ресурса и типа следующим образом:
(12)
i
i
i i r
x
K x
2
= 2 - .
Параметр ri Î [0; 1] можно интерпретировать как количество
ресурса, оптимальное для игрока, так как именно при xi = ri дости-
гается максимум его выигрыша. Центр не знает типы {ri} игроков.
35 Для задач управления оказывается существенным, что равновесная
по Нэшу стратегия каждого из игроков зависит от типов всех игроков
[55, 64, 80, 85].
83
Стратегиями игроков в этой игре являются их заявки si на
ресурс. Подставив (11) в (12), можно выразить функции выигрыша
через стратегии, получив игру в нормальной форме. В этой игре
функции выигрыша игроков зависят не только от их стратегий, но
и от типов ri.
Задача исследователя заключается в том, чтобы предсказать,
насколько это возможно, равновесные заявки игроков.
Можно показать, что в зависимости от типов r1 и r2 игроков
равновесие Нэша в этой игре будет задаваться заявками
(13)
ï ï
î
ï ï
í
ì
> >
+ > £
+ > £
+ £ + £
+
+
+ +
=
× × =
1/ 2, 1/ 2
3 2, 1/ 2
3 2, 1/ 2
3 2, 3 2
(1, 1);
(1, 4 / 3 0.25);
(4 / 3 0.25, 1);
(1.5 0.5 , 0.5 1.5 );
( ( ), ( ))
1 2
1 2 2
1 2 1
1 2 1 2
2
1
1 2 1 2
*
2
*
1
r r
r r r
r r r
r r r r
r
r
r r r r
s s
.
Равновесные заявки зависят от типов {ri} игроков. Если в
дальнейшем исследователь получит точную информацию о типах
игроков, то, подставив значения типов игроков в (13), сможет по-
лучить точное равновесие Нэша этой игры.
Однако полученный результат можно использовать и другим
способом. Пусть исследователю известна та же информация, что и
центру. Пусть игра разыграна один раз, и центр получил от игро-
ков заявки (s1, s2 ) . Тогда, зная (13), центр может узнать типы иг-
роков. Так, например, если обе заявки меньше 1, центр может оп-
ределить типы игроков по формуле:
r1 = 0.75 s1 – 0.25 s2, r2 = 0.75 s2 – 0.25 s1.
Если обе заявки равны 1, центр может сделать вывод, что
типы обоих игроков превышают 0.5. Аналогично можно восста-
новить типы и для случаев, когда лишь одна из заявок равна 1.
Таким образом, по результатам игры центр (а, значит, и исследо-
ватель) может с той или иной точностью восстановить типы иг-
роков. ·
Пример 16 [9, 55]. «Решение задачи «Экспертиза».
Приведем решение задачи примера 2.
84
Сообщение достоверной информации в механизмах планиро-
вания является равновесием в доминантных стратегиях для всех
r ÎW, если: “rÎW, “i ÎN, “si ÎWi , “s-i ÎW-i , выполняется
ji (p i (ri , s-i ), ri ) ³ji (p i (si , s-i ), ri ) .
Для механизма активной экспертизы справедливо следующее
утверждение [55, 64]: для каждого r Î[d, D]n равновесие Нэша
s*(r) имеет следующую структуру:
1)
ïî
ïí ì
>
<
=
*
*
*
, если ;
, если ;
i
i
i d x r
D x r
s
2) если d < si* < D , то x* = ri .
Определим для каждого k = 0, n векторы сообщений:
î í ì
-
=
n k D
k d
s k
( ) последних экспертов сообщают
первых экспертов сообщают ;
( )
и вычислим последовательность точек Wk =p (s(k)) .
Упорядочим экспертов в порядке возрастания ri. В [9] дока-
зано, что всегда найдется такой номер qÎ N , что либо
rq Î[Wq , Wq-1 ], либо rq >Wq-1.
Общий результат, характеризующий решение задачи экспер-
тизы [9, 55, 64], гласит, что итоговое решение в равновесии имеет
вид: max min ( , -1 )
Î
* = k N q q
x r W .
Следовательно, для любой процедуры активной экспертизы
найдется эквивалентный прямой механизм (см. определение в
первой главе). ·

Нечто важное
FUEL ждет коллекционное  издание. FUEL ждет коллек... rating
Diablo III снова без LANa Diablo III снова бе... rating
Watchmen: The End is Nig 2 скоро увидит свет Watchmen: The End is Nig 2... rating
Негодование на полях Starcraft 2 Негодование н... rating
Случайное
Оставьте свой комментарий


Leave a Reply

You must be logged in to post a comment.