本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2022-09-02
摘要
了解個體如何在未知環境中學習是經濟學的重要議題。我們在一個非常簡單的多武裝老虎機框架中對行為進行建模和檢查,其中參與者不知道跨時間的收益結構。我們提出了一個基線強化學習模型,允許在策略空間中進行模式識別和更改。我們還分析了三個增強版本,這些版本適應從其他玩家的行為和/或收益中進行觀察學習。該模型成功地再現了觀察到的發現時間和總收益的分佈特性。我們的研究進一步表明,當兩人中的一個發現隱藏模式時,觀察另一個人的行為和/或回報與基線情況相比可以縮短發現時間。