本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2022-09-02
摘要
GPU 是機器學習和高效能運算革命的關鍵推動者,可作為事實上的協處理器來加速大規模運算。隨著程式設計堆疊和工具支援的成熟,GPU也變得可供程式設計師使用,他們可能缺乏底層架構的詳細知識,無法充分利用GPU的運算能力。 GEVO(使用 EVOlutionary 計算的 GPU 最佳化)是一種自動發現最佳化機會並調整 LLVM 表示中 GPU 核心效能的工具。 GEVO 使用基於群體的搜尋來尋找編譯為 LLVM-IR 的 GPU 程式碼的編輯,並根據所需標準提高效能,同時保留所需的功能。我們證明 GEVO 改善了 Rodinia 基準測試套件中的 GPU 程式以及 NVIDIA Tesla P100 上的機器學習模型、SVM 和 ResNet18 的執行時間。對於 Rodinia 基準測試,GEVO 將 GPU 核心執行時間平均提高了 49.48%,與完全編譯器最佳化的基準相比提高了 412%。如果內核輸出精度放寬到允許最多 1% 的誤差,GEVO 可以找到平均優於基線版本 51.08% 的內核變體。對於機器學習工作負載,GEVO 在 MNIST 手寫辨識 (3.24X) 和 a9a 收入預測 (2.93X) 資料集上實現了 SVM 的核心效能改進,且模型精確度沒有損失。 GEVO 使用 ResNet18/CIFAR-10 在影像分類上實現了 1.79 倍的核心效能提升,模型精度降低了不到 1%。