聖塔非研究所

非編碼 DNA 序列中的長程相關性與部分 1/f 譜

2026-03-18 · 工作論文 · 更新 2026/03/19 上午02:28

摘要 互資訊函數是符號序列相關函數的替代方法,並且針對主要包含內含子片段(不編碼蛋白質的片段)的人類 DNA 序列計算「符號譜」。觀察到該序列的互資訊函數衰減非常緩慢,且相關長度極長(至少800個鹼基)。序列在極低頻率下的符號譜可以用 $1/f^\alpha$ 來近似,其中 $f$ 是頻率,$\alpha$ 的範圍是 0.5 到 0.85。這表明序列中重複模式的存在是觀察到的長…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:工作論文
  • 編號:工作論文 #1620
  • 日期:2026-03-18

摘要

互資訊函數是符號序列相關函數的替代方法,並且針對主要包含內含子片段(不編碼蛋白質的片段)的人類 DNA 序列計算「符號譜」。觀察到該序列的互資訊函數衰減非常緩慢,且相關長度極長(至少800個鹼基)。序列在極低頻率下的符號譜可以用 $1/f^\alpha$ 來近似,其中 $f$ 是頻率,$\alpha$ 的範圍是 0.5 到 0.85。這表明序列中重複模式的存在是觀察到的長程相關性的主要原因。也簡要討論了這種遠程相關性與音符中的相關性之間的可能聯繫。