本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:工作論文
- 編號:工作論文 #120
- 日期:2026-03-18
摘要
我們提出了一個為實體代理程式設計廉價控制架構的框架。我們的推導以通用近似的經典問題為指導,由此我們探索了利用代理的體現來對感覺運動控制生成的行為進行新的、更有效的通用近似的可能性。將這種具體化通用近似與經典的非具體化通用近似進行比較。為了舉例說明我們的方法,我們提出了根據條件限制玻爾茲曼機定義的政策模型的詳細定量案例研究。與需要指數數量的參數的非體現通用近似相比,在體現設定中,我們能夠使用更小的模型來產生所有可能的行為,從而獲得廉價的通用近似。我們用六足行走機進行實驗測試並證實了這個理論。實驗表明,我們的理論預測的足夠控制器複雜度的界限是嚴格的,這意味著理論具有直接的實際意義。