本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:工作論文
- 編號:工作論文 #159
- 日期:2026-03-18
摘要
動機:基於序列的系統發育方法嚴重依賴僅由直系同源序列組成的初始資料集。旁系同源物被視為一種危險的公害,必須被發現並消除。然而,數學系統發育的最新進展表明,只要可以在一定程度上確定區分直向同源物和旁系同源物,基因重複也可以傳遞有意義的系統發育資訊。結果:我們證明,僅從旁系資訊即可推斷出合理的系統發育樹。為此,首先校正直系同源(旁系同源的補充)的無樹估計以符合同形圖,然後轉化為等效的事件標記的基因係統發育。這些樹顯示的三元組的某個子集轉化為對物種樹的限制。雖然單一基因家族的分辨率非常差,但我們觀察到全基因組資料集足以產生幾組真細菌的完全解析的系統發育樹。這裡介紹的新穎方法依賴於解決三個交織的 NP 難以最佳化問題:圖編輯問題、最大一致三元組問題和最小解析樹問題。作為整數線性程序實現,基於旁系的系統發育可以精確計算多達二十個物種及其完整的蛋白質互補物。可用性:ILP 公式是使用 IBM ILOG CPLEXTM Optimizer 12.6 在軟體 ParaPhylo 中實現的,並且可以從 免費取得。