聖塔非研究所

摘要 近年來,資訊理論已成為對機器人和生物的感覺運動動力學感興趣的研究人員的焦點

2022-09-02 · 已發表論文 · 更新 2026/03/19 上午03:39

摘要 近年來,資訊理論已成為對機器人和生物的感覺運動動力學感興趣的研究人員的焦點。這些方法的一個根源是生物體是資訊處理系統,這些過程的最佳化應​​該是一種演化優勢。除了這些更基本的問題之外,最近人們對機器人如何配備創新或好奇心的內部驅動力的問題很感興趣,這可以作為機器人開放式、自主開發的驅動力。這些方法的成功主要取決於選擇一種方便的資訊測量方法。本文詳細研究了感覺運動過程的預測…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:已發表論文
  • 日期:2022-09-02

摘要

近年來,資訊理論已成為對機器人和生物的感覺運動動力學感興趣的研究人員的焦點。這些方法的一個根源是生物體是資訊處理系統,這些過程的最佳化應​​該是一種演化優勢。除了這些更基本的問題之外,最近人們對機器人如何配備創新或好奇心的內部驅動力的問題很感興趣,這可以作為機器人開放式、自主開發的驅動力。這些方法的成功主要取決於選擇一種方便的資訊測量方法。本文詳細研究了感覺運動過程的預測資訊 (PI)(也稱為過剩熵或有效測量複雜性)的使用。流程的 PI 量化了可用於預測未來事件的過去經驗的總資訊。餵!事實上,資訊理論測量在機器人技術中的應用大多局限於有限的、離散的狀態-動作空間的情況。本文旨在將動態系統方法中的 PI 應用於機器人控制。我們首先研究線性系統,並得出 PI 的精確結果以及控制器參數的明確學習規則。有趣的是,這些學習規則具有赫布性質和局部性,因為突觸更新是由相關突觸端口直接可用的活動的產物給出的。一些案例研究證實了一般研究結果。特別是,在一個二維系統中,設計用於模仿具有潛在振盪運動模式的實體系統,結果表明,最大化 PI 意味著識別和放大機器人系統的潛在模式。這個例子和許多其他例子表明,從最大 PI 原理導出的學習規則是複雜機器人系統中自組織行為的通用工具。