摘要機器學習 (ML) 遍及自動程式修復 (APR) 領域｜聖塔非研究所

本頁只刊出中文翻譯與中文說明；英文原文請見下方原文連結。

原文連結

論文資訊

類型：已發表論文
日期：2026-03-12

摘要

機器學習 (ML) 遍及自動程式修復 (APR) 領域。演算法部署神經機器翻譯和大型語言模型（LLM）來產生軟體修補程式以及其他任務。但是，這些機器學習應用與早期工作之間存在重要差異，這使得確保結果有效且可能推廣的任務變得更加複雜。一個挑戰是，最受歡迎的 APR 評估基準在設計時並未考慮到 ML 技術。對於法學碩士來說尤其如此，其龐大且往往公開程度較低的訓練資料集可能包含評估它們的問題。本文回顧了自 2018 年以來在該領域排名前五的機構發表的 APR 工作，強調了該領域的新興趨勢，包括 ML 模型（包括法學碩士）的急劇崛起。基於機器學習的文章按照結構和功能維度進行分類，並確定了這些新方法提出的各種問題。重要的是，資料外洩和污染問題源於使用現有基準驗證基於機器學習的 APR 的挑戰，這些基準是在這些技術流行之前設計的。我們討論評估設計和績效報告中的不一致之處，並提供可用的解決方案。最後，我們強調該領域已經採取的有希望的新方向。