聖塔非研究所

摘要 資料融合已廣泛應用於分析不同的資訊來源,將所有資訊組合在一個多元模型中

2022-09-02 · 已發表論文 · 更新 2026/03/19 上午03:09

摘要 資料融合已廣泛應用於分析不同的資訊來源,將所有資訊組合在一個多元模型中。當必須整合不同的組學資料集以使用系統生物學方法充分理解生物體時,這種方法是強制性的。在此,提出了一種數據融合程序,將菸草蝕刻病毒 (TEV) 收集的基因組、蛋白質組和表型數據集結合起來。基因組數據對應於大多數病毒基因中插入的隨機突變。蛋白質體數據代表了這些突變對編碼蛋白質的影響,以及突變蛋白質對蛋白質…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:已發表論文
  • 日期:2022-09-02

摘要

資料融合已廣泛應用於分析不同的資訊來源,將所有資訊組合在一個多元模型中。當必須整合不同的組學資料集以使用系統生物學方法充分理解生物體時,這種方法是強制性的。在此,提出了一種數據融合程序,將菸草蝕刻病毒 (TEV) 收集的基因組、蛋白質組和表型數據集結合起來。基因組數據對應於大多數病毒基因中插入的隨機突變。蛋白質體數據代表了這些突變對編碼蛋白質的影響,以及突變蛋白質對蛋白質-蛋白質相互作用網絡 (PPIN) 中相鄰蛋白質引起的擾動。最後,對每種突變病毒評估的表型特徵是複製適應性。為了分析這三個資訊來源,擬合了偏最小二乘 (PLS) 迴歸模型,以便從解釋(並關聯)顯著變數與 TEV 適合度的資料中提取潛在變數。此方法的最終輸出是一組與拓撲和突變相關的 PPIN 功能模組。在對這些不同的 TEV 數據進行重新分析的過程中,我們產生了有關某些突變的作用機制以及它們如何轉化為有機體適應性的有價值的資訊。結果表明,一些突變的影響超出了它們直接影響的蛋白質範圍,並在 PPIN 上傳播到鄰近蛋白質,從而定義了功能模組。