聖塔非研究所

摘要 由於基因重複和缺失,屬於多基因家族的基因數量在其演化史上通常有很大差異

2022-09-02 · 已發表論文 · 更新 2026/03/19 上午12:29

摘要 由於基因重複和缺失,屬於多基因家族的基因數量在其演化史上通常有很大差異。詳細分析這些歷史的第一步是推斷沿著基礎系統發育樹的各個邊緣發生的拷貝數變化。相應的最大簡約性使物種樹邊緣的變化總數最小化。然而,錯誤確定的家庭成員人數可能會極大地影響估計。因此,我們透過引入機率模型來增強分析,該模型還考慮了次優的變更分配。從技術上講,這相當於桑科夫簡約演算法的配分函數變體。作為展示應…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:已發表論文
  • 日期:2022-09-02

摘要

由於基因重複和缺失,屬於多基因家族的基因數量在其演化史上通常有很大差異。詳細分析這些歷史的第一步是推斷沿著基礎系統發育樹的各個邊緣發生的拷貝數變化。相應的最大簡約性使物種樹邊緣的變化總數最小化。然而,錯誤確定的家庭成員人數可能會極大地影響估計。因此,我們透過引入機率模型來增強分析,該模型還考慮了次優的變更分配。從技術上講,這相當於桑科夫簡約演算法的配分函數變體。作為展示應用,我們重新分析了後生動物 microRNA 家族的增益和損失模式。如預期的那樣,機率方法和簡約方法之間的差異是中等的,在 T -> 0 的限制下,即對簡約偏差的容忍度非常小,重建變化的總數是相同的。然而,我們發現配分函數方法系統地預測更少的收益和更多的損失事件,這表明數據承認共優解決方案,其中簡約方法選擇有偏差的代表。