聖塔非研究所

論預測理性主體行為的不可能性

2026-03-18 · 工作論文 · 更新 2026/03/18 下午06:57

摘要 經濟學的一個基本假設是,人們是理性的——他們根據對世界未來狀況的預測來選擇最佳的行動計劃。在策略遊戲中,這意味著每個玩家的策略應該是最優的,考慮到他或她對對手策略的預測。我們證明,當玩家不確定對手的收益函數時,理性與預測之間存在著固有的緊張關係。具體來說,在某些遊戲中,無論完全理性的玩家使用什麼學習規則,他們都不可能學會預測對手的未來行為(甚至是近似預測)。原因是,在試圖…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #798
  • 日期:2026-03-18

摘要

經濟學的一個基本假設是,人們是理性的——他們根據對世界未來狀況的預測來選擇最佳的行動計劃。在策略遊戲中,這意味著每個玩家的策略應該是最優的,考慮到他或她對對手策略的預測。我們證明,當玩家不確定對手的收益函數時,理性與預測之間存在著固有的緊張關係。具體來說,在某些遊戲中,無論完全理性的玩家使用什麼學習規則,他們都不可能學會預測對手的未來行為(甚至是近似預測)。原因是,在試圖預測對手下一階段的行為時,理性玩家必須在這一階段採取對手可以觀察到的行動。這種觀察可能會導致對手改變他下一階段的行為,從而使第一個玩家的預測無效。由此產生的回饋循環具有這樣的特性:幾乎在每個時間段,有人預測他的對手有不可忽略的機率選擇一種行動,而事實上對手肯定會選擇不同的行動。我們的結論是,在某些策略情況下,完全理性的代理人原則上不可能僅根據觀察到的行為來學習預測其他完全理性的代理人的未來行為。