近日,中國農業科學院農業基因組研究所農業基因編輯技術研發與應用創新團隊構建了迄今為止規模最大的實驗驗證數據集,并在此基礎上開發了多模態機器學習模型AlphaCD。該模型不僅能夠高效預測超過2萬種胞嘧啶脫氨酶的酶活特征,還能設計出新型高性能堿基編輯工具。該研究為蛋白質功能高通量鑒定和基因編輯工具開發提供了全新研究范式。相關研究成果發表在《細胞研究》 (Cell Research) 上。
胞嘧啶堿基編輯器(CBE)是一類能夠將DNA中的C·G堿基對精準轉換為T·A的基因編輯工具,廣泛應用于疾病治療和動植物育種研究。然而,與腺嘌呤堿基編輯器(ABE)相比,當前的胞嘧啶堿基編輯器普遍面臨效率偏低和脫靶率較高的難題,這些問題嚴重制約了其在臨床醫學和農業領域的推廣應用。
研究人員通過實驗測試了1100種胞嘧啶的催化效率、脫靶效應等指標,建立了首個大規模功能數據庫。結合序列、三維結構及理化性質等多維特征,團隊開發出人工智能模型AlphaCD。
經測試,AlphaCD模型在預測胞嘧啶脫氨酶催化效率、脫靶活性、靶向窗口和基序偏好方面表現出高準確性。借助AlphaCD模型的高通量預測能力,科研人員能夠在龐大的蛋白庫中快速篩選出潛在的功能“王者”,這標志著基因編輯工具的發現過程正被徹底加速和重塑。
盡管當前人工智能大模型在工業領域算力支持下進展迅速,但其高昂的計算成本常使學術界難以承擔。該研究創新性地采用高質量實驗數據集,在個人計算機上采用隨機森林算法訓練輕量化模型,無需依賴昂貴超算資源,就能在預測精度上超越超大規模參數模型,并能將蛋白質功能預測從定性推至高精度定量新階段。
AlphaCD不僅是一款功能預測工具,更代表了蛋白質功能預測新研究范式的誕生,有望重塑基因編輯酶的研發模式,開啟功能導向的蛋白質設計革新。
基因組所研究員左二偉為論文通訊作者,該所博士后徐奎、華國營、張海航和博士生吳明第為論文共同第一作者。該研究得到了國家重點研發計劃、國家自然科學基金等項目的支持。
相關論文信息:https://doi.org/10.1038/s41422-025-01164-x
本文鏈接:AlphaCD發布:蛋白質功能高通量預測全新范式http://www.sq15.cn/show-11-25230-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。