標籤介導的伴侶選擇對不斷演化的群體在重複囚徒困境中的影響｜聖塔非研究所

本頁只刊出中文翻譯與中文說明；英文原文請見下方原文連結。

原文連結

論文資訊

類型：工作論文
編號：工作論文 #1187
日期：2026-03-18

摘要

描述了玩 IPD 的代理的標籤介導的伙伴選擇的簡單模型。代理策略表示為 $(i,q,q)$ 三元組，如 [Nowak 和 May，1992] 所示。標籤表示為 $[0,1]$ 中的任意實數，標籤選擇偏向於具有相似標籤的代理。每個代理商在每一世代中都會扮演其他代理商的一小部分樣本。這些遊戲的累積收益被演化演算法用作適應性度量，該演算法創建了下一代智能體。結果表明，即使是簡單的標籤選擇方案也可以極大地改變玩 IPD 的個體群體的進化動態。在相當廣泛的條件下，使用標籤的群體獲得了顯著更高的合作水平，這主要是由於（1）互惠的初始出現速度更快，以及（2）對相互背叛者入侵的抵抗力更強。即使代理商使用一兩個標籤試驗（搜尋），整體合作也會大大改善，因此即使是高成本的合作夥伴搜尋也可能有用。初步實驗表明，在有利的條件下，即使個人在每個 IPD 遊戲中只玩一到兩輪，簡單的標籤介導的伙伴選擇也可以導致某種互惠的出現。