聖塔非研究所

摘要 估計編碼序列的演化距離必須考慮蛋白質量的選擇,以避免相對低估較長的演化距離

2022-09-02 · 已發表論文 · 更新 2026/03/19 上午04:24

摘要 估計編碼序列的演化距離必須考慮蛋白質量的選擇,以避免相對低估較長的演化距離。目前透過位點到位點速率異質性進行的選擇模型通常忽略了選擇的另一個方面,即位置特異性氨基酸頻率。這些頻率決定了高度分歧但功能和結構保守的序列預期的最大相異性,因此對於估計長距離至關重要。我們引入了編碼序列進化的密碼子級模型,其中位置特異性胺基酸頻率是自由參數。在我們的實作中,這些是使用前面描述的方法…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:已發表論文
  • 日期:2022-09-02

摘要

估計編碼序列的演化距離必須考慮蛋白質量的選擇,以避免相對低估較長的演化距離。目前透過位點到位點速率異質性進行的選擇模型通常忽略了選擇的另一個方面,即位置特異性氨基酸頻率。這些頻率決定了高度分歧但功能和結構保守的序列預期的最大相異性,因此對於估計長距離至關重要。我們引入了編碼序列進化的密碼子級模型,其中位置特異性胺基酸頻率是自由參數。在我們的實作中,這些是使用前面描述的方法根據對齊來估計的。我們使用模擬來證明對此類行為進行建模的重要性和可行性;我們的模型在很寬的距離範圍內產生線性距離估計,而一些替代模型相對於短距離低估了長距離。位點到位點的速率差異以及同義/非同義和第一/第二/第三密碼子位置差異是胺基酸頻率的位點到位點差異的自然結果。