聖塔非研究所

摘要 基因註釋資料庫(科學界維護的描述單一基因所執行的生物學功能的綱要)通常用於評估實驗衍生的基因集的功

2022-09-02 · 已發表論文 · 更新 2026/03/19 上午03:20

摘要 基因註釋資料庫(科學界維護的描述單一基因所執行的生物學功能的綱要)通常用於評估實驗衍生的基因集的功能特性。重疊統計數據,例如費雪精確檢定(FET),通常用於評估這些關聯,但沒有考慮註釋到單一功能的基因數量或與單一基因相關的功能數量的不均勻性。我們發現,如果基因集具有異常多的註釋,則 FET 會強烈偏向於高估重疊顯著性。為了修正這些偏差,我們發展了註釋豐富分析(AEA),它…

本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。

原文連結

論文資訊

  • 類型:已發表論文
  • 日期:2022-09-02

摘要

基因註釋資料庫(科學界維護的描述單一基因所執行的生物學功能的綱要)通常用於評估實驗衍生的基因集的功能特性。重疊統計數據,例如費雪精確檢定(FET),通常用於評估這些關聯,但沒有考慮註釋到單一功能的基因數量或與單一基因相關的功能數量的不均勻性。我們發現,如果基因集具有異常多的註釋,則 FET 會強烈偏向於高估重疊顯著性。為了修正這些偏差,我們發展了註釋豐富分析(AEA),它正確地解釋了註釋的不均勻性。我們表明,AEA 能夠識別具有生物學意義的功能富集,這些功能富集被 FET 中的大量假陽性富集分數所掩蓋,因此我們建議將其用於更準確地評估基因集的生物學特性。