本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2022-09-02
摘要
我們在典型的玩家遊戲中研究自適應學習。遊戲的收益是隨機產生的,然後保持固定。隨著玩家的學習,玩家的策略會隨著時間的推移而演變。策略空間中的軌跡顯示出一系列性質不同的行為,吸引子包括唯一固定點、多個固定點、極限環和混沌。在遊戲複雜的情況下,即玩家可以採取多種可能的行動,我們使用生成函數方法來建立學習動態收斂到穩定固定點的參數範圍。隨著玩家數量趨於無窮大,該區域的大小趨於零,這表明複雜的非平衡行為(以混沌為代表)是許多玩家的複雜遊戲的常態。