檢測到您當前使用浏覽器版本過于老舊,會導緻無法正常浏覽網站;請您使用電腦裡的其他浏覽器如:360、QQ、搜狗浏覽器的極速模式浏覽,或者使用谷歌、火狐等浏覽器。
解決分類群之間的演化關系是演化生物學的基本任務之一。在大數據時代,随着測序技術和分析方法的發展,多項研究發現類群之間的雜交和基因漸滲可能強烈的影響了生命之樹,并在物種形成和适應過程中起到了重要作用。然而,現有基因漸滲檢測方法仍具有一定局限性,如依賴大樣本量、受限的系統發育關系或精确的種群演化曆史等。因此,在基因流廣泛存在的背景下,評估物種之間的複雜關系仍具挑戰。同時,基于深度學習的算法已經迅速成為處理統計應用的有效替代方法,特别是與大數據集有關的應用。目前已有涉及基因漸滲推斷的基于深度學習的相關方法的應用報道,但多是針對具體分類群的初步嘗試,其一般适用性和可推廣性受到了限制。
2023年6月1日,beat365官方网站、蛋白質與植物基因研究國家重點實驗室、北大-清華生命科學聯合中心張蔚課題組,在Systematic Biology雜志在線發表了題為“Inferring historical introgression with deep learning”的研究論文,提出了一種基于深度學習算法檢測基因漸滲的方法ERICA。該方法基于基因組序列信息,通過識别拓撲結構不一緻鑒定基因組内的漸滲區域。該方法能夠有效的在模拟數據和多種動植物分類群的真實基因組數據中檢測漸滲信号,為利用基因組數據評估類群之間的演化關系提供了一種具有一般适用性的新方法,有助于推動雜交和基因漸滲相關的演化研究。
研究構建了處理序列比對數據的卷積神經網絡模型,以定量評估類群之間的演化關系,并通過識别特定基因流對應的拓撲結構推斷漸滲區域(圖1)。研究首先利用模拟數據集對神經網絡進行了訓練和評估,并與其他廣泛使用的基因漸滲檢測方法進行了對比。評估結果顯示神經網絡模型能夠有效地檢測漸滲特别是适應性漸滲信号,且具有較好的泛化能力(圖2)。
圖1 ERICA方法設計原則和神經網絡結構
圖2 ERICA方法準确率評估
此外,研究者使用ERICA方法分析了适應性輻射類群袖蝶屬(Heliconius)的群體基因組數據,并鑒定獲得了已知的翅圖案模式相關漸滲位點,表明ERICA方法能夠在真實數據中檢測到适應性漸滲信号,且具有較傳統方法更小的随機誤差。
之後,研究者展示了ERICA方法的一個應用實例,通過将該方法應用于稻屬(Oryza)基因組比對及泛基因組數據分析,獲得了粳稻和籼稻之間以及從野生稻(O. rufipogon)到籼稻的漸滲位點,其中包括多個與水稻馴化性狀相關的受選擇區域,支持基因流在籼稻馴化過程中起到重要作用(圖3)。此外,研究發現籼稻和野生稻(O. nivara)與熱帶粳稻之間存在基因流,且漸滲基因可能與熱帶粳稻對熱帶環境的适應與抗逆性有關。
圖3 稻屬物種基因組漸滲模式
綜上所述,該研究開發了一種新的基因漸滲檢測方法,其能夠高效處理基因組序列數據,準确推斷局部的漸滲信号,有助于深入理解類群之間的複雜演化曆史以及基因漸滲在物種适應中發揮的作用。值得一提的是,為了滿足研究人員的廣泛要求,該方法包括了一個在線提交門戶和一個本地版本的工具包。因此,該研究不僅提供了一種先進的基因漸滲的研究方法,并且給出了完整的研究解決方案,展示了其解決多個系統中實際問題的能力。
beat365官方网站/北大-清華生命科學聯合中心張蔚研究員和北京腦科學與類腦研究中心張力研究員為本文共同通訊作者;北大-清華生命科學聯合中心博士生張宇博、北京腦科學與類腦研究中心工程師朱慶傑為本文共同第一作者;北京腦科學與類腦研究中心工程師邵毅、北大-清華生命科學聯合中心博士生姜焱晨和華中農業大學生命科學技術學院歐陽亦聃教授對本研究做出了重要貢獻。該項目得到國家自然科學基金、北京市自然科學基金、北大-清華生命科學聯合中心、蛋白質與植物基因研究國家重點實驗室等資助。
原文鍊接:https://doi.org/10.1093/sysbio/syad033