贏則留-輸則變：典範賽的基本學習規則｜聖塔非研究所

本頁只刊出中文翻譯與中文說明；英文原文請見下方原文連結。

原文連結

論文資訊

類型：工作論文
編號：工作論文 #1144
日期：2026-03-18

摘要

在本文中，我們研究了演化背景下迭代範式賽局的簡單學習範式。遵循滿足的決策理論概念，我們設計具有一定願望等級的玩家。如果他們的回報低於這個水平，他們就會改變當前的行動；否則，他們就會重複。我們考慮這種贏留-輸轉移原則的隨機概括，即在將其與他們的願望水平進行比較之前，對幾輪遊戲中收到的回報進行平均，並允許策略在比賽過程中調整其願望水平。我們的分析是雙重的。一方面，我們研究這種囚徒困境策略的演變；另一方面，我們考慮將隨機選擇的遊戲分配給玩家的情況。在存在如此高的不確定性的情況下，「贏留輸」策略被證明是非常成功的。透過電腦模擬，我們解決了以下問題：什麼是有利的願望水平？在更新當前動作之前應該觀察多少輪？噪音有什麼影響？