聖塔非研究所

摘要 NCBI Re fSeq 資料庫提供了大約 2000 個完整定序的粒線體基因組,以及其蛋白質編碼基

2022-09-02 · 已發表論文 · 更新 2026/03/19 上午03:31

摘要 NCBI Re fSeq 資料庫提供了大約 2000 個完整定序的粒線體基因組,以及其蛋白質編碼基因、rRNA 和 tRNA 的手動註釋。這些註釋資訊已經累積了二十多年,是透過多種計算工具和註釋策略獲得的。儘管付出了所有的人工管理努力,但它仍然受到閱讀方向分配錯誤、基因名稱錯誤、缺失以及誤報註釋(尤其是 RNA 基因)的困擾。總而言之,這給旨在全面使用這些數據來研究動物系…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:已發表論文
  • 日期:2022-09-02

摘要

NCBI Re fSeq 資料庫提供了大約 2000 個完整定序的粒線體基因組,以及其蛋白質編碼基因、rRNA 和 tRNA 的手動註釋。這些註釋資訊已經累積了二十多年,是透過多種計算工具和註釋策略獲得的。儘管付出了所有的人工管理努力,但它仍然受到閱讀方向分配錯誤、基因名稱錯誤、缺失以及誤報註釋(尤其是 RNA 基因)的困擾。總而言之,這給旨在全面使用這些數據來研究動物系統發育和有絲分裂基因組分子進化的全自動管道帶來了嚴重問題。 MITOS 管道旨在計算有絲分裂基因組序列的一致從頭註釋。我們表明 MITOS 的結果在註釋覆蓋率和品質方面與 RefSeq 和 MitoZoa 相符。同時,我們避免了源自手動管理策略的偏見、命名不一致和拼字錯誤。 MITOS 管道可上網查閱: