趨同演化是生物演化中的重要現象。長期以來,演化生物學研究致力于探索表型趨同背后的分子適應性演化機制。傳統研究方法聚焦于蛋白序列中單個氨基酸位點的趨同變化。但是,越來越多的證據表明,即使沒有明確的位點趨同,同源蛋白仍可能通過高階結構或理化特征的趨同演化實現功能相似性。?
近日,中國科學院動物研究所鄒征廷團隊提出ACEP計算分析框架,利用預訓練蛋白語言模型,揭示了蛋白高階特征在功能適應性趨同演化中的重要作用。?
通過在海量蛋白序列數據上進行預訓練,蛋白語言模型能夠捕捉序列中復雜的上下文信息和高階特征,將蛋白序列轉化為包含這些演化特征的高維嵌入向量 。研究發現,即使在已知不存在位點趨同的案例中,預訓練蛋白語言模型生成的嵌入向量仍能反映蛋白高階特征的相似性,表明高階特征趨同是蛋白功能趨同的分子基礎。?
基于這一發現,研究團隊設計了ACEP分析流程,其核心包括三個步驟,即計算目標類群同源蛋白嵌入向量的真實距離,通過模擬中性演化過程構建背景距離分布,基于分布對真實距離進行統計檢驗,判斷是否存在顯著的高階特征趨同信號。同時,ACEP在多個已知案例中得到顯著結果。?
進一步,全基因組篩選顯示,ACEP在蝙蝠與齒鯨中識別出數百個具有高階特征趨同信號的候選基因,功能富集分析顯著關聯“感官感知”等條目,涵蓋已知回聲定位基因和多個新候選基因。部分候選基因還得到正選擇檢驗的支持,增強了其發生適應性趨同的可信度。同時,為提升結果的可解釋性,團隊分析了嵌入向量趨同背后的具體高階特征。?
上述究揭示了蛋白高階特征趨同適應性演化的機制,展示了人工智能技術在針對復雜的基因型-表型映射進行演化生物學分析時的潛力。
ACEP框架為在全基因組水平系統挖掘基因的復雜適應性趨同模式提供了新工具,代碼已通過HuggingFace平臺開源。?
相關研究成果發表在《美國國家科學院院刊》(PNAS)上。研究工作得到國家自然科學基金和中國科學院戰略性先導科技專項等的支持。
論文鏈接
代碼
ACEP流程示意圖以及在回聲定位哺乳類中檢測出的與“感官感知”相關的候選適應性趨同基因
本文鏈接:研究揭示蛋白高階特征的適應性趨同演化http://www.sq15.cn/show-12-1835-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: MW級高溫固體顆粒儲熱中試研究取得新進展
下一篇: 哺乳動物頜關節演化有了新證據