摘要 我們使用特異性的定量定義來開發神經網絡,用於識別未對齊 DNA 片段集合中的常見蛋白質結合位點。我們證明了當採用結合能和基因組的簡單模型時,最大化比對位點資訊內容的方法的等效性。網路方法包含了這些簡單的模型,並且能夠處理更複雜的模型。這是使用大腸桿菌基因組的馬可夫模型和近似配分函數的取樣方法來證明的。吉布斯抽樣的變體有助於避免局部最小值。
我們使用特異性的定量定義來開發神經網絡,用於識別未對齊 DNA 片段集合中的常見蛋白質結合位點。我們證明了當採用結合能和基因組的簡單模型時,最大化比對位點資訊內容的方法的等效性。網路方法包含了這些簡單的模型,並且能夠處理更複雜的模型。這是使用大腸桿菌基因組的馬可夫模型和近似配分函數的取樣方法來證明的。吉布斯抽樣的變體有助於避免局部最小值。