本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2026-03-12
摘要
機器學習 (ML) 遍及自動程式修復 (APR) 領域。演算法部署神經機器翻譯和大型語言模型(LLM)來產生軟體修補程式以及其他任務。但是,這些機器學習應用與早期工作之間存在重要差異,這使得確保結果有效且可能推廣的任務變得更加複雜。一個挑戰是,最受歡迎的 APR 評估基準在設計時並未考慮到 ML 技術。對於法學碩士來說尤其如此,其龐大且往往公開程度較低的訓練資料集可能包含評估它們的問題。本文回顧了自 2018 年以來在該領域排名前五的機構發表的 APR 工作,強調了該領域的新興趨勢,包括 ML 模型(包括法學碩士)的急劇崛起。基於機器學習的文章按照結構和功能維度進行分類,並確定了這些新方法提出的各種問題。重要的是,資料外洩和污染問題源於使用現有基準驗證基於機器學習的 APR 的挑戰,這些基準是在這些技術流行之前設計的。我們討論評估設計和績效報告中的不一致之處,並提供可用的解決方案。最後,我們強調該領域已經採取的有希望的新方向。