使用不良訓練資料進行更好的預測｜聖塔非研究所

本頁只刊出中文翻譯與中文說明；英文原文請見下方原文連結。

原文連結

原文連結
PDF 來源

論文資訊

類型：工作論文
編號：工作論文 #1375
日期：2026-03-18

摘要

我們展示瞭如何隨機擾亂訓練資料各個部分的類別的輸出來提高分類演算法的預測準確性。我們提出了一種計算學習演算法「噪音敏感度特徵」的方法，該方法基於對輸出類別的加擾。此簽章可用於指示分類器的複雜性和資料的複雜性之間的良好匹配。使用雜訊敏感度簽章與避免過度訓練的其他方案明顯不同，例如僅使用部分訓練資料的交叉驗證，或不具有資料自適應能力的各種懲罰函數。噪音敏感性簽名方法使用所有訓練數據，並且明顯是數據自適應的和非參數的。它們非常適合訓練資料有限的情況。