多智能體系統學習動態的耦合複製方程｜聖塔非研究所

多智能體系統學習動態的耦合複製方程

2026-03-18 · 工作論文 · 更新 2026/03/18 下午06:23

摘要從一組強化學習代理開始，我們推導出耦合複製方程，描述多代理系統中集體學習的動態。我們表明，儘管智能體以自利的方式對環境進行建模而不共享知識，但博弈動態會透過環境自然地出現。作為一種應用，透過代理商之間的石頭剪刀布遊戲交互，集體學習動態表現出多樣化的競爭和合作行為。這些包括準週期性、穩定極限環、間歇性和確定性混沌——這些行為在通用複製方程式所描述的多智能體、異構環境中是可以…

本頁只刊出中文翻譯與中文說明；英文原文請見下方原文連結。

原文連結

論文資訊

類型：工作論文
編號：工作論文 #737
日期：2026-03-18

摘要

從一組強化學習代理開始，我們推導出耦合複製方程，描述多代理系統中集體學習的動態。我們表明，儘管智能體以自利的方式對環境進行建模而不共享知識，但博弈動態會透過環境自然地出現。作為一種應用，透過代理商之間的石頭剪刀布遊戲交互，集體學習動態表現出多樣化的競爭和合作行為。這些包括準週期性、穩定極限環、間歇性和確定性混沌——這些行為在通用複製方程式所描述的多智能體、異構環境中是可以預期的。