觀察與強化模式學習：一項探索性研究｜聖塔非研究所

觀察與強化模式學習：一項探索性研究

2026-03-18 · 工作論文 · 更新 2026/03/18 上午11:31

摘要抽象的。我們在一個非常簡單的多臂老虎機框架中透過實驗和理論研究個人如何了解未公開的跨期支付結構。我們提出了一個基線強化學習模型，該模型允許策略空間中的模式識別和相關變化，以及它的三個增強版本，可以適應從與他們匹配的另一個玩家的行為和/或收益中進行觀察學習。這些模型很好地再現了觀察到的發現時間的分佈特性。我們的研究進一步表明，與其中一人發現隱藏模式的基線情況相比，觀察另一…

本頁只刊出中文翻譯與中文說明；英文原文請見下方原文連結。

原文連結

論文資訊

類型：工作論文
編號：工作論文 #16
日期：2026-03-18

摘要

抽象的。我們在一個非常簡單的多臂老虎機框架中透過實驗和理論研究個人如何了解未公開的跨期支付結構。我們提出了一個基線強化學習模型，該模型允許策略空間中的模式識別和相關變化，以及它的三個增強版本，可以適應從與他們匹配的另一個玩家的行為和/或收益中進行觀察學習。這些模型很好地再現了觀察到的發現時間的分佈特性。我們的研究進一步表明，與其中一人發現隱藏模式的基線情況相比，觀察另一個人的行為和/或利益可以提高發現能力。