用於確定蛋白質特異性和結合位點多重比對的神經網絡｜聖塔非研究所

用於確定蛋白質特異性和結合位點多重比對的神經網絡

2026-03-18 · 工作論文 · 更新 2026/03/19 上午12:29

摘要我們使用特異性的定量定義來開發神經網絡，用於識別未對齊 DNA 片段集合中的常見蛋白質結合位點。我們證明了當採用結合能和基因組的簡單模型時，最大化比對位點資訊內容的方法的等效性。網路方法包含了這些簡單的模型，並且能夠處理更複雜的模型。這是使用大腸桿菌基因組的馬可夫模型和近似配分函數的取樣方法來證明的。吉布斯抽樣的變體有助於避免局部最小值。

本頁只刊出中文翻譯與中文說明；英文原文請見下方原文連結。

原文連結

論文資訊

類型：工作論文
編號：工作論文 #1377
日期：2026-03-18

摘要

我們使用特異性的定量定義來開發神經網絡，用於識別未對齊 DNA 片段集合中的常見蛋白質結合位點。我們證明了當採用結合能和基因組的簡單模型時，最大化比對位點資訊內容的方法的等效性。網路方法包含了這些簡單的模型，並且能夠處理更複雜的模型。這是使用大腸桿菌基因組的馬可夫模型和近似配分函數的取樣方法來證明的。吉布斯抽樣的變體有助於避免局部最小值。