聖塔非研究所

基於相似性的多維訊號分割

2026-03-18 · 工作論文 · 更新 2026/03/18 上午11:40

摘要 動機:時間序列和基因組資料的分割是計算生物學的常見問題。隨著測量程序日益複雜,各個數據點通常不僅僅是數字或簡單向量,其中所有組件都屬於同一類型。利用單一實值資料軌跡中的斜率或明確利用資料向量性質的分析方法不適用於此類場景。結果:我們在這裡開發了一個用於在任意資料域中進行分割的框架,該框架只需要最少的相似性概念。使用輸入(樣本)的無監督聚類產生近似分割演算法,該演算法對於全…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #28
  • 日期:2026-03-18

摘要

動機:時間序列和基因組資料的分割是計算生物學的常見問題。隨著測量程序日益複雜,各個數據點通常不僅僅是數字或簡單向量,其中所有組件都屬於同一類型。利用單一實值資料軌跡中的斜率或明確利用資料向量性質的分析方法不適用於此類場景。結果:我們在這裡開發了一個用於在任意資料域中進行分割的框架,該框架只需要最少的相似性概念。使用輸入(樣本)的無監督聚類產生近似分割演算法,該演算法對於全基因組應用來說足夠有效。作為展示應用程序,我們使用相似性度量來分割來自芽殖酵母的轉錄組測序數據的時間序列,該相似性度量側重於整個代謝週期的相對錶達譜,而不是每個時間點的覆蓋範圍。可用性:該軟體可作為 R 套件從 獲取