聖塔非研究所

摘要 目前的非編碼 RNA (ncRNA) 基因組篩選預測了大量含有潛在結構 ncRNA 的基因組區域

2022-09-02 · 已發表論文 · 更新 2026/03/19 上午03:41

摘要 目前的非編碼 RNA (ncRNA) 基因組篩選預測了大量含有潛在結構 ncRNA 的基因組區域。這些數據的分析需要高度準確地預測 ncRNA 邊界,並從弱預測中區分出有希望的候選 ncRNA。現有方法難以實現這些目標,因為它們依賴基於序列的多重序列比對,這種比對經常使 RNA 結構錯位,因此不支持結構相似性的識別。為了克服這個限制,我們根據序列和結構相似性計算比對的列向…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:已發表論文
  • 日期:2022-09-02

摘要

目前的非編碼 RNA (ncRNA) 基因組篩選預測了大量含有潛在結構 ncRNA 的基因組區域。這些數據的分析需要高度準確地預測 ncRNA 邊界,並從弱預測中區分出有希望的候選 ncRNA。現有方法難以實現這些目標,因為它們依賴基於序列的多重序列比對,這種比對經常使 RNA 結構錯位,因此不支持結構相似性的識別。為了克服這個限制,我們根據序列和結構相似性計算比對的列向和全局可靠性;我們將這些基於結構的比對可靠性稱為 STAR。逐列 STAR 比對或 STAR 配置檔案為 ncRNA 的手動和自動分析提供了多功能工具。特別是,我們將廣泛使用的 ncRNA 基因查找器 RNAz 的邊界預測從 47 nt 的中位數偏差提高了 3 倍到 13 nt。呸!在處理 RNAz 預測後,LocARNA-P 的 STAR 分數比 RNAz 自己的評估更能區分真陽性和假陽性預測。在這種情況下,準確性從 AUC 0.71 增加到 AUC 0.87,顯著降低了連續分析步驟的成本。即用型軟體工具 LocARNA-P 可與相關的列 STAR 進行基於結構的多重 RNA 比對,並預測 ncRNA 邊界。我們提供額外的結果、LocARNA/LocARNA-P 的網路伺服器以及軟體包,包括文件和用於精煉結構 ncRNA 篩選的管道,網址為