本頁只刊出中文翻譯與中文說明;英文原文請見下方原文連結。
原文連結
論文資訊
- 類型:已發表論文
- 日期:2022-09-02
摘要
研究不同多拷貝基因家族的一個挑戰是破解巨大序列變異中的不同功能類型。在某些情況下,功能變化可以透過基因家族的演化史來追蹤;然而,在基因家族主要透過重組來實現多樣化的情況下,系統發育方法是不可能的。我們採用網絡理論方法對瘧原蟲惡性瘧原蟲的高度重組 var 抗原基因家族進行功能分類。我們從加納當地人群中採樣了 var DBLa 序列類型,並將其中 9,276 個變體分類為 48 個功能類型。我們的方法是先將每個序列類型分解為其組成部分,重新組合部分;然後,我們使用隨機區塊模型來識別部件之間的功能組;最後,我們根據序列類型包含的官能基對序列類型進行分類。這種功能分類方法不依賴推斷的系統發育歷史,也不依賴基於保守序列特徵的推斷功能。相反,它根據與其他部分共享相似的共現交互作用來推斷重組部分之間的功能相似性。因此,該方法可以將具有不可檢測的序列同源性甚至不同起源的序列分組。描述這 48 種功能類型使我們能夠將資料集中的抗原多樣性簡化兩個數量級以上。我們考慮 var 功能類型如何在隔離中分佈,並發現非隨機模式,反映常見的 var 功能類型在功能組成方面彼此非隨機不同。將 var 基因多樣性粗粒度化為具有生物學意義的功能組,對於了解該系統的疾病生態和演化以及設計有效的流行病學監測和介入具有重要意義。