模仿人類學習的學習演算法｜聖塔非研究所

本頁只刊出中文翻譯與中文說明；英文原文請見下方原文連結。

原文連結

原文連結
PDF 來源

論文資訊

類型：工作論文
編號：工作論文 #1666
日期：2026-03-18

摘要

本文探討了校準學習演算法以匹配人類代理在一般多選擇環境中學習的方式和速率的想法。它開發了一種參數化隨機學習演算法，分析其動態，並根據心理學實驗的人類學習數據校準其參數。由此產生的校準演算法似乎在很大程度上複製了人類的學習行為。因此，它可以用來用代表「實際」人類行為的「校準代理」來取代適當的新古典模型中理想化的、完全理性的代理。本文討論了使用該演算法在正常形式階段博弈和更一般的經濟學新古典模型中表示人類學習的可能性。它探討了收斂到長期最適性、納許行為的可能性，以及人類在經濟中適應中隱含的「特徵學習時間」。