資訊理論和決策中的觀察局限性｜聖塔非研究所

本頁只刊出中文翻譯與中文說明；英文原文請見下方原文連結。

原文連結

論文資訊

類型：工作論文
編號：工作論文 #235
日期：2026-03-18

摘要

我們引入了一個通用框架，用於形式化和分析決策者（DM）在觀察能力的資訊理論限制下所面臨的問題。 Netzer 和 Robson (NR) 的隨機效用模型和「享樂效用」模型是該框架的特例。我們首先將資訊理論應用到我們的框架中，得出有關觀察限制下 DM 預期後悔的一般結果。然後，我們將注意力轉向觀察限制對選擇行為的影響（而不是該行為引起的後悔值），重點關注 NR 的特殊情況。首先，我們提供 NR 所做的兩個假設的簡單推導，然後提供 NR 結果，即特定的特徵效用函數滿足某些最優性原則。然後，我們擴展 NR 以允許世界上有一組可數而不是不可數的狀態。在此擴充中，我們特別展示如何使用動態規劃來求解 DM 的最優偏好順序。我們還透過考慮向 DM 提供兩個以上選項的情況來擴展 NR，表明在這種情況下 NR 的結果會改變。