聖塔非研究所

使用不良訓練資料進行更好的預測

2026-03-18 · 工作論文 · 更新 2026/03/19 上午12:29

摘要 我們展示瞭如何隨機擾亂訓練資料各個部分的類別的輸出來提高分類演算法的預測準確性。我們提出了一種計算學習演算法「噪音敏感度特徵」的方法,該方法基於對輸出類別的加擾。此簽章可用於指示分類器的複雜性和資料的複雜性之間的良好匹配。使用雜訊敏感度簽章與避免過度訓練的其他方案明顯不同,例如僅使用部分訓練資料的交叉驗證,或不具有資料自適應能力的各種懲罰函數。噪音敏感性簽名方法使用所有訓…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #1375
  • 日期:2026-03-18

摘要

我們展示瞭如何隨機擾亂訓練資料各個部分的類別的輸出來提高分類演算法的預測準確性。我們提出了一種計算學習演算法「噪音敏感度特徵」的方法,該方法基於對輸出類別的加擾。此簽章可用於指示分類器的複雜性和資料的複雜性之間的良好匹配。使用雜訊敏感度簽章與避免過度訓練的其他方案明顯不同,例如僅使用部分訓練資料的交叉驗證,或不具有資料自適應能力的各種懲罰函數。噪音敏感性簽名方法使用所有訓練數據,並且明顯是數據自適應的和非參數的。它們非常適合訓練資料有限的情況。