聖塔非研究所

與環境同步:智能體學習的資訊理論約束

2026-03-18 · 工作論文 · 更新 2026/03/18 下午07:05

摘要 我們表明,資訊源產生的序列的香農熵收斂於源熵率的方式可用於監控智能代理如何建構和有效使用其環境的預測模型。我們引入了環境表觀記憶的自然測量以及必須(i)從代理的觀察中提取以與環境同步的信息量以及(ii)由代理存儲以進行最佳預測的信息量。如果忽略結構屬性,則錯過的規律性將轉換為明顯的隨機性。相反,使用假設過多記憶體的表示會導致錯誤的可預測性。

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #818
  • 日期:2026-03-18

摘要

我們表明,資訊源產生的序列的香農熵收斂於源熵率的方式可用於監控智能代理如何建構和有效使用其環境的預測模型。我們引入了環境表觀記憶的自然測量以及必須(i)從代理的觀察中提取以與環境同步的信息量以及(ii)由代理存儲以進行最佳預測的信息量。如果忽略結構屬性,則錯過的規律性將轉換為明顯的隨機性。相反,使用假設過多記憶體的表示會導致錯誤的可預測性。