聖塔非研究所

多智能體系統學習動態的耦合複製方程

2026-03-18 · 工作論文 · 更新 2026/03/18 下午06:23

摘要 從一組強化學習代理開始,我們推導出耦合複製方程,描述多代理系統中集體學習的動態。我們表明,儘管智能體以自利的方式對環境進行建模而不共享知識,但博弈動態會透過環境自然地出現。作為一種應用,透過代理商之間的石頭剪刀布遊戲交互,集體學習動態表現出多樣化的競爭和合作行為。這些包括準週期性、穩定極限環、間歇性和確定性混沌——這些行為在通用複製方程式所描述的多智能體、異構環境中是可以…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #737
  • 日期:2026-03-18

摘要

從一組強化學習代理開始,我們推導出耦合複製方程,描述多代理系統中集體學習的動態。我們表明,儘管智能體以自利的方式對環境進行建模而不共享知識,但博弈動態會透過環境自然地出現。作為一種應用,透過代理商之間的石頭剪刀布遊戲交互,集體學習動態表現出多樣化的競爭和合作行為。這些包括準週期性、穩定極限環、間歇性和確定性混沌——這些行為在通用複製方程式所描述的多智能體、異構環境中是可以預期的。