蛋白質工程基于蛋白質的靈活性,通過人工手段改變氨基酸序列,實現對蛋白質結構和功能的修飾和改造。與基因組工程相比,蛋白質工程可直接對蛋白質分子進行操縱,借助突變的迭代積累,快速完成蛋白功能優化和創新。
蛋白質工程改造策略包括結構引導的蛋白質理性設計和定向進化,但這些方法往往依賴經驗,存在實驗周期長、成本高等問題,限制了規模化應用。理想的蛋白質工程策略應能夠以最小投入實現最優工程性能。當前,通過訓練特定蛋白專有的人工智能模型實現突變模擬和功能改造是蛋白質工程新方向。但是,這些模型在拓展應用到多種蛋白時存在困難,面臨通用性欠佳問題;同時,模型訓練和下游驗證需要大量的計算和實驗成本,限制了應用。因此,亟需開發高效、普適且無需復雜模型訓練的蛋白質工程計算模擬策略,以最大限度地減少計算負荷、實現最大化性能。
近日,中國科學院遺傳與發育生物學研究所高彩霞團隊基于整合的結構與進化約束的通用逆折疊模型,開發出新型人工智能蛋白質工程計算模擬方法AiCE(AI-informed Constraints for protein Engineering)。這一方法無需訓練專屬人工智能模型,即可實現蛋白質高效進化模擬和功能設計。該團隊利用AiCE對多種基因編輯工具進行進化優化,實現了效率和精度的快速提升。
蛋白質逆折疊是利用AI模型,通過給定三維結構預測可兼容序列的過程。通用的蛋白質逆折疊模型通過天然蛋白質結構和序列的訓練,可以隱式學習蛋白質骨架的幾何和物理特性,捕捉由進化動力學塑造的蛋白質序列的復雜分布模式。
該團隊基于現有通用逆折疊模型開發出AiCEsingle模塊。具體來說,該團隊基于給定的蛋白質三維結構,對逆折疊模型輸出的氨基酸序列開展采樣,來提名高頻出現的氨基酸類型,進一步通過結構約束對氨基酸頻率開展差異篩選,得到最終預測的單個氨基酸替換類型。團隊利用60個深度突變掃描數據,測試AiCEsingle性能,發現其實現了16%的預測準確率;通過消融實驗和邏輯回歸分析,證明結構限制在方法中的必要性,相比于無限制方案性能提升了37%。進一步,平行比較分析顯示,AiCEsingle相比于其他常見AI模型實現了36%至90%以上的性能提升。從蛋白類型來看,AiCEsingle實現了復雜蛋白和蛋白質-核酸復合物如CRISPR蛋白、SARS-CoV-2病毒蛋白等的有效進化,具有廣泛的通用性。為克服突變組合廣泛存在的負向上位效應,團隊假設存在進化耦合的氨基酸位置可能存在功能協同,構建了通過預測進化耦合性來預測突變組合位置的AiCEmulti模塊。6個突變文庫的分析結果表明,AiCEmulti與蛋白質大模型SaProt預測能力相當,但計算成本極低。
該團隊建立的包含兩類模塊的AiCE方法,可實現單突和組合突變的快速有效預測。這一方法利用現有的通用逆折疊模型而無需重新/遷移訓練專有蛋白模型,降低了計算成本,只需1.15個CPU時即可識別SpCas9蛋白的單突和雙突變體。
進一步,利用這一方法,該團隊在濕實驗層面實現了包括脫氨酶、核定位序列、核酸酶和逆轉錄酶等8種結構和功能多樣蛋白質的AiCE功能驗證,證明了其簡單、高效和通用性。借助優化的脫氨酶,團隊開發了可用于精準醫療和分子育種的新型堿基編輯器,包括編輯窗口縮小近一半的新型胞嘧啶堿基編輯器enABE8e、保真度提升1.3倍的新型腺嘌呤堿基編輯器enSdd6-CBE以及活性提升13倍的新型線粒體堿基編輯器enDdd1-DdCBE。
研究發現,與傳統蛋白質工程方案相比,AiCE在效率、可擴展性和通用性方面均具有優勢。
7月7日,相關研究成果以Advancing protein evolution with inverse folding models integrating structural and evolutionary constraints為題,發表在《細胞》(Cell)上。研究工作得到農業農村部相關項目、國家自然科學基金、國家重點研發計劃等的支持。
常見蛋白質工程方法的示意圖和AiCE方法概述
本文鏈接:基于人工智能的通用蛋白質工程方法成功開發http://www.sq15.cn/show-12-1421-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 研究開發出原位代謝靶向的功能菌篩選、培養和強化技術
下一篇: 原子核質量測量揭示新質子幻數