聖塔非研究所

摘要 為了評估微生物群落(包括居住在人體中的微生物群落)的功能能力,鳥槍法宏基因組讀取通常與已知基因的資

2022-09-02 · 已發表論文 · 更新 2026/03/19 上午03:23

摘要 為了評估微生物群落(包括居住在人體中的微生物群落)的功能能力,鳥槍法宏基因組讀取通常與已知基因的資料庫進行比對。这种基于同源性的注释实践主要依赖于这样的假设:短读段可以映射到具有相似功能的直系同源基因。然而,这一假设以及影响短读注释的各种因素尚未得到系统评估。為了應對這項挑戰,我們產生了一個極其龐大的模擬讀取資料庫(總計 15.9 GB),涵蓋超過 500,000 個微生…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:已發表論文
  • 日期:2022-09-02

摘要

為了評估微生物群落(包括居住在人體中的微生物群落)的功能能力,鳥槍法宏基因組讀取通常與已知基因的資料庫進行比對。这种基于同源性的注释实践主要依赖于这样的假设:短读段可以映射到具有相似功能的直系同源基因。然而,这一假设以及影响短读注释的各种因素尚未得到系统评估。為了應對這項挑戰,我們產生了一個極其龐大的模擬讀取資料庫(總計 15.9 GB),涵蓋超過 500,000 個微生物基因和 170 個精選基因組,並且對於許多基因組來說,包括給定長度的每個可能的讀取。我們使用常見的宏基因組協議對每個讀取進行註釋,充分錶徵讀取長度、定序錯誤、系統發育、資料庫覆蓋率和映射參數的影響。我们还严格量化了基因、基因组和协议特定的注释偏差。總的來說,我們的研究結果首次對功能宏基因組註釋的能力和局限性進行了全面評估,為未來的宏基因組研究提供了關鍵的特定目標最佳實踐指南。