記者27日從中國農業科學院獲悉,該院農業基因組研究所農業基因編輯技術研發與應用創新團隊構建了全球規模最大的實驗驗證數據集,并基于此開發出人工智能(AI)大模型AlphaCD。該模型不僅能高效預測超過2萬余種胞嘧啶脫氨酶的酶活特征,還能設計出新型高性能堿基編輯工具。相關成果日前發表于國際期刊《細胞研究》。
胞嘧啶堿基編輯器是一種基因編輯工具,廣泛應用于疾病治療、動植物育種等研究領域。“但傳統胞嘧啶堿基編輯器研發依賴大量試錯實驗,成本高、周期長,且難以系統優化酶活特征。”論文通訊作者、中國農業科學院農業基因組研究所研究員左二偉說。
為破解這一難題,研究團隊歷時3年,實驗測試了1100種胞嘧啶脫氨酶變體的催化效率、脫靶效應等核心指標,首次建立了覆蓋多維功能特征的大規模實驗數據庫。
基于該數據庫,團隊整合蛋白質序列、三維結構、理化性質等多模態數據,開發出AlphaCD。經嚴格驗證,AlphaCD在預測胞嘧啶脫氨酶催化效率、脫靶活性、靶向窗口及基序偏好等關鍵指標時,準確性顯著優于傳統方法。
“AlphaCD突破了當前AI大模型依賴超算資源的局限。”左二偉介紹,研究團隊采用隨機森林算法發現,在個人計算機上即可完成模型訓練。這一輕量化設計能讓學術機構低成本開展高通量功能預測。
記者27日從中國農業科學院獲悉,該院農業基因組研究所農業基因編輯技術研發與應用創新團隊構建了全球規模最大的實驗驗證數據集,并基于此開發出人工智能(AI)大模型AlphaCD。該模型不僅能高效預測超過2萬余種胞嘧啶脫氨酶的酶活特征,還能設計出新型高性能堿基編輯工具。相關成果日前發表于國際期刊《細胞研究》。
胞嘧啶堿基編輯器是一種基因編輯工具,廣泛應用于疾病治療、動植物育種等研究領域。“但傳統胞嘧啶堿基編輯器研發依賴大量試錯實驗,成本高、周期長,且難以系統優化酶活特征。”論文通訊作者、中國農業科學院農業基因組研究所研究員左二偉說。
為破解這一難題,研究團隊歷時3年,實驗測試了1100種胞嘧啶脫氨酶變體的催化效率、脫靶效應等核心指標,首次建立了覆蓋多維功能特征的大規模實驗數據庫。
基于該數據庫,團隊整合蛋白質序列、三維結構、理化性質等多模態數據,開發出AlphaCD。經嚴格驗證,AlphaCD在預測胞嘧啶脫氨酶催化效率、脫靶活性、靶向窗口及基序偏好等關鍵指標時,準確性顯著優于傳統方法。
“AlphaCD突破了當前AI大模型依賴超算資源的局限。”左二偉介紹,研究團隊采用隨機森林算法發現,在個人計算機上即可完成模型訓練。這一輕量化設計能讓學術機構低成本開展高通量功能預測。
本文鏈接:設計基因編輯工具的AI大模型問世http://www.sq15.cn/show-2-13599-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
下一篇: 西氣東輸重要工程首條山嶺隧道貫通