摘要 GPU 是機器學習和高效能運算革命的關鍵推動者，可作為事實上的協處理器來加速大規模運算｜聖塔非研究所

本頁只刊出中文翻譯與中文說明；英文原文請見下方原文連結。

原文連結

SFI 頁面

論文資訊

類型：已發表論文
日期：2022-09-02

摘要

GPU 是機器學習和高效能運算革命的關鍵推動者，可作為事實上的協處理器來加速大規模運算。隨著程式設計堆疊和工具支援的成熟，GPU也變得可供程式設計師使用，他們可能缺乏底層架構的詳細知識，無法充分利用GPU的運算能力。 GEVO（使用 EVOlutionary 計算的 GPU 最佳化）是一種自動發現最佳化機會並調整 LLVM 表示中 GPU 核心效能的工具。 GEVO 使用基於群體的搜尋來尋找編譯為 LLVM-IR 的 GPU 程式碼的編輯，並根據所需標準提高效能，同時保留所需的功能。我們證明 GEVO 改善了 Rodinia 基準測試套件中的 GPU 程式以及 NVIDIA Tesla P100 上的機器學習模型、SVM 和 ResNet18 的執行時間。對於 Rodinia 基準測試，GEVO 將 GPU 核心執行時間平均提高了 49.48%，與完全編譯器最佳化的基準相比提高了 412%。如果內核輸出精度放寬到允許最多 1% 的誤差，GEVO 可以找到平均優於基線版本 51.08% 的內核變體。對於機器學習工作負載，GEVO 在 MNIST 手寫辨識 (3.24X) 和 a9a 收入預測 (2.93X) 資料集上實現了 SVM 的核心效能改進，且模型精確度沒有損失。 GEVO 使用 ResNet18/CIFAR-10 在影像分類上實現了 1.79 倍的核心效能提升，模型精度降低了不到 1%。