聖塔非研究所

重複隨機賽局中策略的演變

2026-03-18 · 工作論文 · 更新 2026/03/18 下午07:04

摘要 提出了一個使用有限狀態策略演化來研究合作行為演化的框架。代理之間的交互作用是透過具有隨機可觀察收益的重複博弈來建模的。因此,與廣泛用於調查不斷發展的群體中合作條件的囚徒困境相比,特工面臨更複雜(和一般)的情況。儘管如此,在代理群體中通常會形成一種強有力的合作策略。在合作模式中,該策略選擇一個允許最大化雙方玩家在每輪中的收益總和的動作,而不管他們自己的收益如何。兩種這樣的策…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #814
  • 日期:2026-03-18

摘要

提出了一個使用有限狀態策略演化來研究合作行為演化的框架。代理之間的交互作用是透過具有隨機可觀察收益的重複博弈來建模的。因此,與廣泛用於調查不斷發展的群體中合作條件的囚徒困境相比,特工面臨更複雜(和一般)的情況。儘管如此,在代理群體中通常會形成一種強有力的合作策略。在合作模式中,該策略選擇一個允許最大化雙方玩家在每輪中的收益總和的動作,而不管他們自己的收益如何。兩種這樣的策略可以最大化預期的總收益。如果對手偏離了這個方案,策略就會呼叫懲罰動作,例如,可以在剩餘的(可能無限次)重複遊戲中實現單輪納許均衡。在遊戲中引入錯誤實際上推動了進化變得更加合作,儘管乍一看,它使遊戲更加合作。