本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2022-09-02
摘要
背景:差異 RNA 定序 (dRNA-seq) 是一種高通量篩選技術,旨在檢查細菌操縱子的整體結構,特別是轉錄起始位點 (TSS) 的精確位置。迄今為止,dRNA-seq 數據的分析方法是可視化映射到參考基因組的定序讀取並手動註釋的可靠位置。這是非常勞動密集型的,並且由於主觀性而存在偏見。結果:在這裡,我們提出了 TSSAR,這是一種從 dRNA-seq 數據中自動進行 TSS 註釋的工具,該工具尊重 dRNA-seq 文庫的統計數據。 TSSAR 使用的前提是,從轉錄活性區域內某個基因組位置開始的定序讀取數量遵循泊松分佈,其參數取決於局部表達強度。因此,兩個 dRNA-seq 文庫計數的差異遵循 Skellam 分佈。這為識別顯著富集的初級轉錄物提供了統計基礎。我們透過使用 TSSAR 和兩種利用使用者定義的分數截止值的簡單方法分析公開可用的 dRNA-seq 資料集來評估效能。我們評估了再現手動 TSS 註釋的能力。此外,使用相同的數據集透過 RACE 或引子延伸等可靠技術在幽門螺旋桿菌中重現了 74 個經過實驗驗證的 TSS。兩個分析均顯示 TSSAR 優於靜態截止相關方法。結論:擁有一個自動化、高效的 dRNA-seq 數據分析工具有助於 dRNA-seq 技術的使用,並促進其應用於更複雜的分析。例如,監測由不同刺激和生長條件觸發的轉錄組結構的可塑性和動態變得可能。 dRNA-seq 分析新工具能夠涵蓋廣泛的使用者群體,其主要資產是可用性。因此,我們提供 TSSAR 作為直覺的 RESTfulWeb 服務 ( 以及一組後處理和分析工具,以及用於高通量 dRNA-seq 資料分析流程的獨立版本。