本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:工作論文
- 編號:工作論文 #1144
- 日期:2026-03-18
摘要
在本文中,我們研究了演化背景下迭代範式賽局的簡單學習範式。遵循滿足的決策理論概念,我們設計具有一定願望等級的玩家。如果他們的回報低於這個水平,他們就會改變當前的行動;否則,他們就會重複。我們考慮這種贏留-輸轉移原則的隨機概括,即在將其與他們的願望水平進行比較之前,對幾輪遊戲中收到的回報進行平均,並允許策略在比賽過程中調整其願望水平。我們的分析是雙重的。一方面,我們研究這種囚徒困境策略的演變;另一方面,我們考慮將隨機選擇的遊戲分配給玩家的情況。在存在如此高的不確定性的情況下,「贏留輸」策略被證明是非常成功的。透過電腦模擬,我們解決了以下問題:什麼是有利的願望水平?在更新當前動作之前應該觀察多少輪?噪音有什麼影響?