本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2022-09-02
摘要
背景:直系同源分析是生物資訊學許多領域(例如比較基因組學和分子系統發育學)資料分析的重要組成部分。序列資料的不斷增加,以及因此可以同時比較的基因組數量的迅速增加,需要高效的軟體工具,因為具有二次記憶體要求的強力方法在實踐中變得不可行。此外,新資料的快速出現使得需要計算給定資料集的全基因組直系關係,而不是依賴資料庫中列出的關係。結果:此處所述的程式 Proteinortho 是一個獨立工具,適用於大型資料集,並在多核心硬體上執行時利用分散式運算技術。它實現了倒數最佳對齊啟發式的擴展版本。我們應用 Proteinortho 來計算 2009 年初 NCBI 提供的所有 717 個真細菌基因組的完整集合中的直向同源蛋白質。我們鑑定了 99% 的所有細菌蛋白質組中存在的 30 種蛋白質。結論:與現有工具相比,Proteinortho 顯著減少了直系同源分析所需的記憶體量,從而允許在現成的硬體上執行此類計算。