本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2024-03-12
摘要
不同類型缺陷病毒基因組 (DVG) 的產生是 RNA 病毒複製容易出錯的不可避免的結果。近年來,一類特定的 DVG,即含有長缺失或基因組重排的 DVG,由於其潛在的治療和生物技術應用而引起了人們的興趣。在高通量定序 (HTS) 資料中識別此類 DVG 已成為一個有趣的計算問題。已經提出了幾種演算法來實現這一目標,儘管所有演算法都會產生誤報,如果必須在實驗室中合成和測試此類 DVG,那麼這就是一個實際問題。我們提出了一種元搜尋工具 DVGfinder,它將兩種最常用的 DVG 搜尋演算法包裝在一個工作流程中,用於識別 HTS 資料中的 DVG。 DVGfinder 處理 ViReMa-a 和 DI-tector 的結果,並使用梯度增強分類器機器學習演算法來減少誤報事件的數量。該程式還產生用戶友好的 HTML 格式的輸出文件,這可以幫助用戶探索範例中識別的 DVG。我們評估了 DVGfinder 與單獨使用的兩種搜尋演算法相比的效能,發現它略微提高了低覆蓋率合成 HTS 資料的靈敏度和高覆蓋率樣本的 DI-tector 精度。元搜尋程序也對真實樣本表現出更高的敏感性,之前驗證了一組回錄。