本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2022-09-02
摘要
系統基因組學在很大程度上依賴精心策劃的序列資料集,其中每個基因僅包含 1:1 直系同源物。旁系同源物被視為一種危險的公害,必須被發現並消除。我們在這裡表明,對資料集的這種嚴格限制是沒有必要的。基於數學系統發育學的最新進展,我們證明基因重複傳達了有意義的系統發育訊息,並允許推斷出合理的系統發育樹,前提是可以在一定程度上確定區分直向同源物和旁系同源物。從直系同源的無樹估計開始,圖譜編輯可以充分減少噪音,以找到正確的事件註釋基因樹。基因樹的資訊可以直接轉化為對物種樹的約束。儘管單一基因家族的分辨率非常差,但我們表明,即使存在水平基因轉移,全基因組資料集也足以產生完全解析的系統發育樹。