聖塔非研究所

摘要 分析、计算生物学和自然语言处理

2022-09-02 · 已發表論文 · 更新 2026/03/18 下午09:56

摘要 分析、计算生物学和自然语言处理。從複製資料集或從具有不同方法或參數設定的相同資料獨立獲得的分割提出了計算聚合或一致分割的問題。這個分段聚合問題相當於找出一個能夠最小化到輸入分段的距離總和的分段。這又是一個分段問題,可以透過動態規劃來解決。本貢獻的目的是 (1) 更好地理解分段聚合問題及其解決方案,以及 (2) 證明共識分段具有有用的應用。擴展先前已知的結果,我們表明,對於…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:已發表論文
  • 日期:2022-09-02

摘要

分析、计算生物学和自然语言处理。從複製資料集或從具有不同方法或參數設定的相同資料獨立獲得的分割提出了計算聚合或一致分割的問題。這個分段聚合問題相當於找出一個能夠最小化到輸入分段的距離總和的分段。這又是一個分段問題,可以透過動態規劃來解決。本貢獻的目的是 (1) 更好地理解分段聚合問題及其解決方案,以及 (2) 證明共識分段具有有用的應用。擴展先前已知的結果,我們表明,對於一大類距離函數,只有至少一個輸入分段中存在的斷點出現在共識分段中。此外,我們得出了共識段大小的界限。作為展示應用,我們研究了酵母轉錄組,並表明共有片段提供了識別轉錄組單元的可靠方法。這種方法特別適合具有多順反子轉錄物、操縱子或轉錄物之間缺乏分離的密集轉錄組。作為第二個應用,我們證明共識分割可用於從一組複製生長曲線中穩健地識別生長機制。