聖塔非研究所

RNAcode:比較序列資料中編碼和非編碼區域的穩健區分

2026-03-18 · 工作論文 · 更新 2026/03/18 下午02:02

摘要 由於可以獲得大量的比較序列數據,演化分析已成為基因組功能註釋的強大工具。評估保守區域的編碼潛力以及區分編碼與非編碼轉錄本是一項核心分析任務。在這裡,我們介紹 RNAcode,一個用於檢測多個序列比對中的編碼區域的程序,該程序針對當前基因查找軟體未涵蓋的新興應用進行了最佳化。我們的演算法將核苷酸替換和缺口模式的資訊結合在一個統一的框架中,並處理現實生活中的問題,例如比對和定…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #269
  • 日期:2026-03-18

摘要

由於可以獲得大量的比較序列數據,演化分析已成為基因組功能註釋的強大工具。評估保守區域的編碼潛力以及區分編碼與非編碼轉錄本是一項核心分析任務。在這裡,我們介紹 RNAcode,一個用於檢測多個序列比對中的編碼區域的程序,該程序針對當前基因查找軟體未涵蓋的新興應用進行了最佳化。我們的演算法將核苷酸替換和缺口模式的資訊結合在一個統一的框架中,並處理現實生活中的問題,例如比對和定序錯誤。它使用沒有機器學習組件的顯式統計模型,因此可以“開箱即用”,無需任何訓練,即可應用於生活各個領域的資料。我們描述了RNAcode方法,並將其與質譜實驗相結合來預測和確認大腸桿菌中的七種新型短肽,並分析先前註釋為「非編碼」的RNA的編碼潛力。 RNAcode 是開源軟體,可用於所有主要平台: