本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2022-09-02
摘要
動機:高通量定序方法可以快速且經濟高效地對整個轉錄組進行定序。短 RNA 定序不僅提供定量表現數據,還提供鑑定新型編碼和非編碼 RNA 的機會。許多長轉錄物經過轉錄後處理,產生短 RNA 序列片段。映射回參考基因組,它們形成獨特的模式,傳達有關親代轉錄本結構及其處理方式的訊息。來自 microRNA 前體的 miR-miR* 模式是最著名的例子,但絕不是唯一的例子。結果:deepBlockAlign 引入了一種兩步驟方法來對齊 RNA-seq 讀取模式,目的是快速識別具有相似處理足跡的 RNA。重疊的映射讀取首先合併為區塊,然後將緊密間隔的區塊組合為區塊組,每個區塊代表一個表達基因座。為了比較區塊組,首先使用修改的序列比對演算法來比較組成區塊以確定區塊對的相似性分數。在第二階段,透過修改的桑科夫演算法來比較區塊模式,該演算法考慮區塊相似性和區塊組內距離模式的相似性。塊組的層次聚類清楚地分離了大多數 miRNA 和 tRNA,並且還識別了大約十幾個與 miRNA 聚類在一起的 tRNA。大多數這些假定的 Dicer 處理的 tRNA,包括文獻中報導的產生具有 miRNA 樣特徵的產物的 8 個案例,都表現出透過精確的讀取起始位置來區分的讀取區塊。