本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2024-03-12
摘要
識別新的藥物-標靶交互作用是藥物發現的關鍵和限速步驟。雖然深度學習模型已經被提出來加速識別過程,但在這裡我們表明,最先進的模型無法推廣到新穎的(即從未見過的)結構。我們揭示了造成這一缺點的機制,展示了模型如何依賴利用蛋白質-配體二分網路拓撲的捷徑,而不是學習節點特徵。在這裡,我們介紹 AI-Bind,這是一種將基於網路的採樣策略與無監督預訓練相結合的管道,以改進新型蛋白質和配體的結合預測。我們透過對接模擬和與最近的實驗證據進行比較來驗證 AI-Bind 預測,並透過識別氨基酸序列上潛在的活性結合位點來加快解釋蛋白質-配體結合的機器學習預測的過程。 AI-Bind 是一種識別藥物標靶組合的高通量方法,有可能成為藥物發現的強大工具。藥物發現中最先進的機器學習模型無法可靠地預測註釋不良的蛋白質和小分子的結合特性。 Here, the authors present AI-Bind, a machine learning pipeline to improve generalizability and interpretability of binding predictions.