| 本條目存在以下問題,請協助 改善本條目或在 討論頁針對議題發表看法。
| 此條目需要 精通或熟悉相關主題的編者參與及協助編輯。 (2011年3月12日) 請邀請適合的人士改善本條目。更多的細節與詳情請參見討論頁。 |
|
信號博弈(英語:signaling game),是一種由一個發送者(S)和另一個接收者(R)所組成的動態博弈。一開始這個發送者有一個給定的類型(t),接著發送者會觀察這個沒有其他人(好比說接收者)知道的類型,去從訊息堆 M = {m1, m2, m3,..., mj} 中選擇送出一個訊息(m),接著接收者會觀察這個訊息後從他可行的動作中 A = {a1, a2, a3,...., ak} 選一個作為反應動作(a),這裡要注意的是接收者除了訊息之外其他都無法得知(如發送者的類型t),接著根據(t, m, a)的組合來決定雙方會獲得的報酬或回報。
每種類型的發送者發送的消息都滿足消息集合M中的概率分布,設
表示
類型的發送者發送M中任意消息的概率。接收者觀察到消息m後作出的反應動作
也滿足行動集合A中的概率分布。
精煉貝葉斯均衡需要滿足下面四個條件:
- 接收者知道對任意的消息m,哪些類型的發送者會發送m。也即他知道發送m的發送者屬於
類型的概率
,這個概率對所有類型
求和應該等於1。
- 接收者選擇的行動應該按照他對上一個條件的認知
最大化他的預期效用,即選擇適當的行動,使得
最大化。記這個最大化預期效用的行動為
。
- 根據上述條件確定的接收者策略
,對每種類型
,發送者選擇的消息
應該最大化發送者的預期效用
。
- 對發送者可能發送的每種消息
,如果至少存在一種類型
使得
等於
的概率嚴格大於零(即至少存在一種類型的發送者可能會發送消息m),那麼接收者收到消息
之後認為發送者屬於t類型的後驗概率
滿足貝葉斯定理:
。