本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:工作論文
- 編號:工作論文 #1187
- 日期:2026-03-18
摘要
描述了玩 IPD 的代理的標籤介導的伙伴選擇的簡單模型。代理策略表示為 $(i,q,q)$ 三元組,如 [Nowak 和 May,1992] 所示。標籤表示為 $[0,1]$ 中的任意實數,標籤選擇偏向於具有相似標籤的代理。每個代理商在每一世代中都會扮演其他代理商的一小部分樣本。這些遊戲的累積收益被演化演算法用作適應性度量,該演算法創建了下一代智能體。結果表明,即使是簡單的標籤選擇方案也可以極大地改變玩 IPD 的個體群體的進化動態。在相當廣泛的條件下,使用標籤的群體獲得了顯著更高的合作水平,這主要是由於(1)互惠的初始出現速度更快,以及(2)對相互背叛者入侵的抵抗力更強。即使代理商使用一兩個標籤試驗(搜尋),整體合作也會大大改善,因此即使是高成本的合作夥伴搜尋也可能有用。初步實驗表明,在有利的條件下,即使個人在每個 IPD 遊戲中只玩一到兩輪,簡單的標籤介導的伙伴選擇也可以導致某種互惠的出現。