聖塔非研究所

資訊理論和決策中的觀察局限性

2026-03-18 · 工作論文 · 更新 2026/03/18 下午01:43

摘要 我們引入了一個通用框架,用於形式化和分析決策者(DM)在觀察能力的資訊理論限制下所面臨的問題。 Netzer 和 Robson (NR) 的隨機效用模型和「享樂效用」模型是該框架的特例。我們首先將資訊理論應用到我們的框架中,得出有關觀察限制下 DM 預期後悔的一般結果。然後,我們將注意力轉向觀察限制對選擇行為的影響(而不是該行為引起的後悔值),重點關注 NR 的特殊情況。…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #235
  • 日期:2026-03-18

摘要

我們引入了一個通用框架,用於形式化和分析決策者(DM)在觀察能力的資訊理論限制下所面臨的問題。 Netzer 和 Robson (NR) 的隨機效用模型和「享樂效用」模型是該框架的特例。我們首先將資訊理論應用到我們的框架中,得出有關觀察限制下 DM 預期後悔的一般結果。然後,我們將注意力轉向觀察限制對選擇行為的影響(而不是該行為引起的後悔值),重點關注 NR 的特殊情況。首先,我們提供 NR 所做的兩個假設的簡單推導,然後提供 NR 結果,即特定的特徵效用函數滿足某些最優性原則。然後,我們擴展 NR 以允許世界上有一組可數而不是不可數的狀態。在此擴充中,我們特別展示如何使用動態規劃來求解 DM 的最優偏好順序。我們還透過考慮向 DM 提供兩個以上選項的情況來擴展 NR,表明在這種情況下 NR 的結果會改變。