聖塔非研究所

隨機動力學神經流形的選擇標準

2026-03-18 · 工作論文 · 更新 2026/03/18 下午01:45

摘要 我們提出了定義神經流形(隨機矩陣模型)的方法,這些方法與目標函數的最大化(例如強化學習理論中的預期獎勵)相容。我們的方法基於資訊幾何,旨在減少模型參數,希望能改進梯度學習過程。

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #239
  • 日期:2026-03-18

摘要

我們提出了定義神經流形(隨機矩陣模型)的方法,這些方法與目標函數的最大化(例如強化學習理論中的預期獎勵)相容。我們的方法基於資訊幾何,旨在減少模型參數,希望能改進梯度學習過程。