聖塔非研究所

隨機成對排列

2026-03-18 · 工作論文 · 更新 2026/03/18 下午06:26

摘要 動機:相關核酸或蛋白質之間的序列保守水平通常沿著序列有很大差異。具有高變異性的區域(突變熱點)和幾乎完美序列同一性的區域可能出現在同一對分子中。因此,比對的可靠性很大程度取決於局部序列相似性的程度。結果:第一個序列中的位置 $i$ 和第二個序列中的位置 $j$ 之間的匹配機率 P$ {ij}$ 使用所有規範成對比對上的配分函數進行計算。然後可以使用機率回溯過程來產生具有正…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #742
  • 日期:2026-03-18

摘要

動機:相關核酸或蛋白質之間的序列保守水平通常沿著序列有很大差異。具有高變異性的區域(突變熱點)和幾乎完美序列同一性的區域可能出現在同一對分子中。因此,比對的可靠性很大程度取決於局部序列相似性的程度。結果:第一個序列中的位置 $i$ 和第二個序列中的位置 $j$ 之間的匹配機率 P$_{ij}$ 使用所有規範成對比對上的配分函數進行計算。然後可以使用機率回溯過程來產生具有正確統計權重的次優對齊的集合。基於結構的對齊和隨機對齊的大樣本之間的比較表明,儘管最佳對齊明顯偏離結構對齊,但整體包含具有顯著機率的正確對齊。因此,透過隨機回溯獲得的次優對齊的集合,或是匹配機率矩陣本身,是改進迭代多重對齊過程的有希望的起點。特別是,應該可以克服在早期迭代中修復不正確的成對比對的問題。可用性:本貢獻中所述的軟體可從 下載。