本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:工作論文
- 編號:工作論文 #1382
- 日期:2026-03-18
摘要
在本文中,我們報告了簡單神經網路和簡單機器學習方法在 DNA 序列分析中的兩個問題的應用的初步定量結果。我們考慮的兩個問題是:(1)確定原核和真核生物DNA序列片段是否被翻譯成蛋白質。據報導,原核 DNA(大腸桿菌)的準確度為 99.4%,真核生物 DNA(已知在肝臟中表達的「智人」基因)的準確度為 98.4%。 (2)確定含有二核苷酸「AG」或「GT」的真核生物DNA序列片段是否轉錄成RNA剪接點。內含子/外顯子剪接點(受體位點)的準確度為 1.2%,外顯子/內含子剪接點(供體位點)的準確度為 94.5%。透過使用對未註釋的鹼基序列進行操作的資訊處理演算法並且不依賴生物實驗室工作來解決這兩個問題與人類基因組計劃相關。使用各種神經網路、機器學習和資訊理論演算法。 (就本文而言,我們僅將神經網路視為一種資訊處理過程,並且不考慮這些形式模型與神經元生物網路的可能關係。)所獲得的準確性超過了文獻中提供的定量結果的先前研究的準確性。它們源自於一項正在進行的研究計劃,該計劃將機器學習演算法應用於確定 DNA 序列的生物功能問題。列出了使用這些方法對可能的新基因的一些預測——儘管使用這些方法對 GenBank 的智人和大腸桿菌部分進行的完整調查將在其他地方給出。