聖塔非研究所

協助分析保守同線性訊息

2026-03-18 · 工作論文 · 更新 2026/03/18 下午03:20

摘要 動機:在過去的幾年裡,已有 20 多個脊椎動物基因組被定序,基因組 DNA 資訊的獲取速度正在迅速加快。基因重複和基因缺失事件本質上限制了僅基於序列相似性的直系同源檢測的準確性。確實存在用於直系同源註釋的全自動方法,但通常無法識別大基因家族中的個體成員,或無法區分缺失資料和可追蹤基因缺失。在許多情況下,可以透過包含保守的同線性資訊來改善這種情況。結果:在這裡,我們展示了 …

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #409
  • 日期:2026-03-18

摘要

動機:在過去的幾年裡,已有 20 多個脊椎動物基因組被定序,基因組 DNA 資訊的獲取速度正在迅速加快。基因重複和基因缺失事件本質上限制了僅基於序列相似性的直系同源檢測的準確性。確實存在用於直系同源註釋的全自動方法,但通常無法識別大基因家族中的個體成員,或無法區分缺失資料和可追蹤基因缺失。在許多情況下,可以透過包含保守的同線性資訊來改善這種情況。結果:在這裡,我們展示了 SynBlast 管道,旨在建立和評估本地同線性資訊。 SynBlast 使用焦點參考基因周圍的基因組區域從目標基因組集合中檢索同源區域的候選區域,並根據現有的同源性證據對它們進行排名。該管道旨在作為一種工具來幫助高品質的手動註釋,特別是在自動程式失敗的情況下。我們以脊椎動物 Hox 和 ParaHox 簇為例,示範如何應用 SynBlast 檢索直系同源和旁系同源簇。軟體:用 Perl 編寫的 SynBlast 軟體包可根據 GNU 通用公共授權在 上取得。