基于骨架結(jié)構(gòu)的蛋白質(zhì)序列設(shè)計(jì)是全新蛋白質(zhì)設(shè)計(jì)的關(guān)鍵問(wèn)題之一。近年來(lái),隨著深度學(xué)習(xí)方法和技術(shù)的發(fā)展,全新蛋白質(zhì)序列設(shè)計(jì)取得了重要進(jìn)展。其中代表性的工作包括ProteinMPNN、ABACUS-R、ProDesign-LE等,都在序列設(shè)計(jì)中取得了重要進(jìn)展,并進(jìn)行了相應(yīng)的實(shí)驗(yàn)驗(yàn)證。然而,這些代表性的方法在模型訓(xùn)練和結(jié)果輸出中均沒(méi)有直接考慮蛋白質(zhì)側(cè)鏈的原子細(xì)節(jié)信息。一方面,蛋白質(zhì)側(cè)鏈構(gòu)象對(duì)蛋白質(zhì)執(zhí)行功能具有重要作用。另一方面,大量的序列設(shè)計(jì)算法依賴(lài)結(jié)構(gòu)預(yù)測(cè)來(lái)評(píng)估設(shè)計(jì)序列的可靠性,而單序列結(jié)構(gòu)預(yù)測(cè)依舊是一個(gè)非常大的挑戰(zhàn)。近期,北京大學(xué)化學(xué)與分子工程學(xué)院/前沿交叉學(xué)科研究院定量生物學(xué)中心/北大-清華生命科學(xué)聯(lián)合中心/北京大學(xué)成都前沿交叉生物技術(shù)研究院教授來(lái)魯華和北京大學(xué)化學(xué)與分子工程學(xué)院副研究員張長(zhǎng)勝團(tuán)隊(duì)發(fā)展了全原子蛋白質(zhì)序列設(shè)計(jì)的深度學(xué)習(xí)算法GeoSeqBuilder,這一成果近期發(fā)表于Angewandte Chemie1,文章初稿2024年3月以預(yù)印本形式發(fā)表2。GeoSeqBuilder在生成序列的同時(shí),也給出了高精度的側(cè)鏈構(gòu)象,可以更直接給出原子之間的相互作用,不需要進(jìn)行單序列結(jié)構(gòu)預(yù)測(cè)。GeoSeqBuilder在天然蛋白質(zhì)結(jié)構(gòu)、全新設(shè)計(jì)結(jié)構(gòu)和酶的序列設(shè)計(jì)的實(shí)驗(yàn)測(cè)試中獲得了高成功率,解析的晶體結(jié)構(gòu)與設(shè)計(jì)結(jié)構(gòu)模型在原子尺度細(xì)節(jié)上高度吻合。
GeoSeqBuilder主要包含三部分:(1)多尺度圖卷積網(wǎng)絡(luò)用于學(xué)習(xí)中心殘基周?chē)?階鄰居的環(huán)境信息;(2)三角網(wǎng)絡(luò)用于表示學(xué)習(xí)殘基水平的二體和三體相互作用;(3)迭代模塊基于以上網(wǎng)絡(luò)從起始序列出發(fā)更新序列,多步迭代后得到收斂序列。GeoSeqBuilder最終輸出設(shè)計(jì)序列對(duì)應(yīng)的蛋白質(zhì)全原子模型。具體見(jiàn)圖1。
圖1 GeoSeqBuilder框架圖
GeoSeqBuilder在CATH4.3數(shù)據(jù)集上進(jìn)行訓(xùn)練和驗(yàn)證,序列恢復(fù)率達(dá)到了52%,與ProteinMPNN等方法的表現(xiàn)類(lèi)似。此外,GeoSeqBuilder設(shè)計(jì)出來(lái)的各位點(diǎn)的殘基類(lèi)型通常和野生型具有相似的物理化學(xué)性質(zhì)。GeoSeqBuilde生成的各種殘基的豐度與天然蛋白類(lèi)似。GeoSeqBuider對(duì)側(cè)鏈構(gòu)象預(yù)測(cè)的結(jié)果也遠(yuǎn)優(yōu)于基于傳統(tǒng)能量函數(shù)的方法FASPR和Scwrl4(見(jiàn)圖 2)。
圖2 GeoSeqBuilder的序列和側(cè)鏈構(gòu)象預(yù)測(cè)結(jié)果
該工作首先選擇了兩個(gè)典型的蛋白質(zhì)折疊骨架對(duì)GeoSeqBuilder生成的序列進(jìn)行實(shí)驗(yàn)驗(yàn)證,包括天然硫氧還原蛋白(1FB0)和通過(guò)幻想模型人工設(shè)計(jì)的螺旋束骨架(0705)。作者分別為其設(shè)計(jì)了9條和6條序列,這些序列均可以在大腸桿菌中以可溶形式表達(dá)。對(duì)硫氧還原蛋白重新設(shè)計(jì)的序列具有很高的熱穩(wěn)定性,熱變性溫度較野生型蛋白提高了40攝氏度,X-射線晶體學(xué)結(jié)構(gòu)解析表明設(shè)計(jì)的全原子模型與所解出的晶體結(jié)構(gòu)高度吻合,并且設(shè)計(jì)蛋白質(zhì)擁有新的疏水堆積核心,具體見(jiàn)圖3。
圖3 GeoSeqBuider成功為靶標(biāo)1FB0和0705設(shè)計(jì)了序列,設(shè)計(jì)模型與晶體結(jié)構(gòu)高度一致
以上結(jié)果表明GeoSeqBuilder學(xué)習(xí)到了蛋白質(zhì)折疊結(jié)構(gòu)和序列的關(guān)系,可以在保持蛋白質(zhì)折疊結(jié)構(gòu)正確性的同時(shí)設(shè)計(jì)出新的疏水核心。一般認(rèn)為疏水核心在蛋白序列的自然進(jìn)化過(guò)程中是比較保守的,疏水核心重新設(shè)計(jì)后的蛋白是否還會(huì)保持原有的功能是一個(gè)很有趣的問(wèn)題。作者選擇細(xì)胞鐵死亡中的關(guān)鍵蛋白谷胱甘肽過(guò)氧化物酶(gpx4,PDB代碼2obi)作為研究對(duì)象,固定gpx4的溶劑暴露殘基位點(diǎn),只設(shè)計(jì)gpx4的疏水核心區(qū)域,并選擇5條序列進(jìn)行實(shí)驗(yàn)驗(yàn)證,其中4條序列的蛋白可以測(cè)出gpx4的酶反應(yīng)活性,3條活性高于野生型蛋白。作者隨后解出了這4個(gè)有酶活性的設(shè)計(jì)蛋白的高分辨晶體結(jié)構(gòu),均與計(jì)算設(shè)計(jì)的結(jié)構(gòu)模型在原子水平上高度一致(圖4)。
圖4 應(yīng)用GeoSeqBuilder為靶標(biāo)gpx4設(shè)計(jì)了5種新的疏水核心堆積方式,其中3條序列對(duì)應(yīng)蛋白的酶活性有顯著提高
該工作發(fā)展了一種基于蛋白質(zhì)骨架結(jié)構(gòu)和全原子模型的序列設(shè)計(jì)方法GeoSeqBuilder。該方法所設(shè)計(jì)的蛋白質(zhì)可溶性好、表達(dá)量和熱穩(wěn)定性高,可以折疊成預(yù)設(shè)計(jì)的蛋白質(zhì)結(jié)構(gòu)。值得注意的是,GeoSeqBuilder不僅提供了與實(shí)驗(yàn)結(jié)構(gòu)一致的側(cè)鏈構(gòu)象,新設(shè)計(jì)的序列還提供了多樣化的疏水核心堆積方式,從而擴(kuò)大了序列景觀。GeoSeqBuilder不僅在蛋白質(zhì)序列從頭設(shè)計(jì)中具有重要意義,而且為蛋白質(zhì)工程和蛋白質(zhì)序列結(jié)構(gòu)關(guān)系研究提供了新的視角。GeoSeqBuilder目前已開(kāi)源(https://github.com/PKUliujl/GeoSeqBuilder),為蛋白質(zhì)相關(guān)的科學(xué)研究和生產(chǎn)開(kāi)發(fā)提供了得力的工具。
該工作的第一作者為北大-清華生命科學(xué)聯(lián)合中心2020級(jí)研究生劉佳樂(lè),通訊作者為來(lái)魯華、張長(zhǎng)勝。北大-清華生命科學(xué)聯(lián)合中心研究生郭政、北大化學(xué)學(xué)院博士后由瀚天對(duì)該工作的完成作出了重要貢獻(xiàn)。相關(guān)工作得到了國(guó)家重點(diǎn)研發(fā)計(jì)劃(2022YFA303700)和國(guó)家自然科學(xué)基金委員會(huì)項(xiàng)目(21977007,22237002,T2321001)的資助。
參考文獻(xiàn)
[1] Jiale Liu, Zheng Guo, Hantian You, Changsheng Zhang*, and Luhua Lai*. All-Atom Protein Sequence Design Based on Geometric Deep Learning.Angew. Chem. Int. Ed. 2024, e202411461.
[2] Jiale Liu, Zheng Guo, Changsheng Zhang*, and Luhua Lai*. All-atom protein sequence design based on geometric deep learning. bioRxiv(2024):2024-03.
本文鏈接:北京大學(xué)團(tuán)隊(duì)在全原子蛋白質(zhì)序列設(shè)計(jì)中取得新進(jìn)展http://www.sq15.cn/show-12-5-0.html
聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。