在合成生物學與工業生物制造領域,密碼子優化是提升外源基因表達水平的關鍵環節。然而,傳統方法往往依賴高頻密碼子替換,這一策略雖然能夠在一定程度上提高表達效率,但可能破壞自然序列中與蛋白折疊和翻譯動力學相關的“稀有密碼子簇”,產生不表達或低表達現象。
近日,中國科學院天津工業生物技術研究所研究員江會鋒團隊在密碼子優化研究方面取得進展。研究團隊開發出基于深度學習的密碼子優化模型DeepCodon。該模型在提升密碼子偏好性的同時,盡可能保留功能相關的稀有密碼子特征,為工程菌株序列設計提供了新思路。
DeepCodon以人工智能學習密碼子選擇規律為基礎,建立從蛋白質到編碼序列的“翻譯映射”。在大規模序列數據訓練的基礎上,研究團隊對高表達基因進行微調,使模型在生成合理密碼子序列的同時能夠兼顧高表達性能。進一步,DeepCodon引入條件概率策略,優先保護進化上保守、與功能相關的稀有密碼子簇,避免傳統方法過度使用高頻密碼子帶來的翻譯擁堵和錯誤折疊風險。
在實驗驗證中,研究團隊分別利用DeepCodon與傳統方法優化20個基因,并在大腸桿菌中表達。結果顯示,9個DeepCodon優化基因表達高于傳統方法,10個基因與傳統方法相當,僅1個基因低于傳統方法。目前,該工具主要面向大腸桿菌應用場景,并提供免費在線密碼子優化服務。
相關成果已發表在《生物設計研究》(BioDesign Research)上。研究工作得到國家自然科學基金和中國科學院戰略性先導科技專項的支持。
蛋白表達密碼子優化服務
論文鏈接
DeepCodon示意圖
本文鏈接:研究開發基于深度學習的密碼子優化模型http://www.sq15.cn/show-12-1768-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 金屬材料疲勞強度理論極限研究獲進展
下一篇: 研究開發蛋白質遷移學習方法助力膀胱癌診斷