本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2026-03-12
摘要
動機 揭示人類相互作用組以揭示疾病特異性模式並發現藥物標靶取決於準確的蛋白質-蛋白質相互作用 (PPI) 預測。然而,由於缺乏高品質的硬負樣本、捷徑學習以及對新型蛋白質的泛化性有限,機器學習 (ML) 模型仍面臨挑戰。 結果在這項研究中,我們引入了一種新方法,透過利用捕獲 PPI 固有的互補驅動機制的高階網絡特徵,對蛋白質-蛋白質非相互作用 (PPNI) 進行策略性採樣。接下來,我們介紹針對 PPI 調整的節點屬性的無監督預訓練 (UPNA-PPI),這是一種高通量序列到功能的 ML 管道,它將蛋白質表示學習中的無監督預訓練與拓撲 PPNI (TPPNI) 樣本相結合,能夠有效篩選數十億種相互作用。透過使用我們的 TPPNI 訓練 UPNA-PPI 模型,我們提高了 PPI 預測的普遍性和可解釋性,特別是在識別氨基酸序列上的潛在結合位點位置、加強篩選分析的優先級以及促進跨蛋白質家族和同源二聚體的 ML 預測的可轉移性方面。 UPNA-PPI 透過整合來自網路拓撲的見解,為圖機器學習中的基本負採樣方法奠定了基礎。可用性和實作程式碼和 UPNA-PPI 預測可在 免費取得。