聖塔非研究所

貝葉斯推理中「證據」和「奧卡姆因素」的嚴格考察

2026-03-18 · 工作論文 · 更新 2026/03/19 上午02:09

摘要 本文首先回顧了貝葉斯「證據」過程背後的推理,該過程用於設定歸納推理所涉及的機率分佈中的參數。本文進而證明該證據程序是錯誤的。更準確地說,本文證明了證據程序中的假設「並沒有」像所聲稱的那樣「讓數據決定分佈」。相反,這些假設只是用新分佈隱式取代包含自由參數的原始分佈,而新分佈的參數都不是自由的。例如,如 MacKay [1991] 在神經網路中所使用的,證據過程是一種使用訓練…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #1582
  • 日期:2026-03-18

摘要

本文首先回顧了貝葉斯「證據」過程背後的推理,該過程用於設定歸納推理所涉及的機率分佈中的參數。本文進而證明該證據程序是錯誤的。更準確地說,本文證明了證據程序中的假設「並沒有」像所聲稱的那樣「讓數據決定分佈」。相反,這些假設只是用新分佈隱式取代包含自由參數的原始分佈,而新分佈的參數都不是自由的。例如,如 MacKay [1991] 在神經網路中所使用的,證據過程是一種使用訓練集來確定分佈 $P({w_i}) \propto \exp(\alpha \sum^N_{i=1} w^2_i)$ 中的自由參數 $\alpha$ 的方法,其中 $Nw_i$ 是網路中的 $Nw_i$N 權重。如同本文所證明的,實際上,MacKay 使用證據程序的假設「不會」導致某些 $\alpha$ 的分佈 $P({w_i}) \propto \exp(\alpha \sum^N_{i=1} w^2_i)$,而是導致無參數分佈 $P({w_i}) \propto} w^2_i)$,而是導致無參數分佈 $P({w_i}) \propto_\gf^N_\p.本文繼續證明,如果除了證據程序中使用的假設之外,還假設參數值未知的“熵先驗”,那麼先驗是完全固定的,但以一種“不能”是熵的形式。 (這對聲稱「從第一原理」導出熵先驗的眾多論證的自洽性提出了質疑。)最後,本文繼續研究涉及奧卡姆因子的奧卡姆剃刀的貝葉斯第一原理「證明」。這篇論文證明了這個「證據」是有缺陷的。