聖塔非研究所

贏則留-輸則變:典範賽的基本學習規則

2026-03-18 · 工作論文 · 更新 2026/03/18 下午11:18

摘要 在本文中,我們研究了演化背景下迭代範式賽局的簡單學習範式。遵循滿足的決策理論概念,我們設計具有一定願望等級的玩家。如果他們的回報低於這個水平,他們就會改變當前的行動;否則,他們就會重複。我們考慮這種贏留 輸轉移原則的隨機概括,即在將其與他們的願望水平進行比較之前,對幾輪遊戲中收到的回報進行平均,並允許策略在比賽過程中調整其願望水平。我們的分析是雙重的。一方面,我們研究這種…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #1144
  • 日期:2026-03-18

摘要

在本文中,我們研究了演化背景下迭代範式賽局的簡單學習範式。遵循滿足的決策理論概念,我們設計具有一定願望等級的玩家。如果他們的回報低於這個水平,他們就會改變當前的行動;否則,他們就會重複。我們考慮這種贏留-輸轉移原則的隨機概括,即在將其與他們的願望水平進行比較之前,對幾輪遊戲中收到的回報進行平均,並允許策略在比賽過程中調整其願望水平。我們的分析是雙重的。一方面,我們研究這種囚徒困境策略的演變;另一方面,我們考慮將隨機選擇的遊戲分配給玩家的情況。在存在如此高的不確定性的情況下,「贏留輸」策略被證明是非常成功的。透過電腦模擬,我們解決了以下問題:什麼是有利的願望水平?在更新當前動作之前應該觀察多少輪?噪音有什麼影響?