近日,中國(guó)科學(xué)院微生物研究所吳邊和崔穎璐團(tuán)隊(duì)在《創(chuàng)新》(The Innovation)上發(fā)表了題為Structure-based self-supervised learning enables ultrafast protein stability prediction upon mutation的研究論文。該研究開(kāi)發(fā)出基于結(jié)構(gòu)自監(jiān)督學(xué)習(xí)的深度學(xué)習(xí)框架Pythia。Pythia可以快速預(yù)測(cè)蛋白質(zhì)突變的穩(wěn)定性變化(ΔΔG)。這一研究揭示了蛋白質(zhì)三維結(jié)構(gòu)蘊(yùn)含的進(jìn)化語(yǔ)義信息與熱力學(xué)穩(wěn)定性之間的深層關(guān)聯(lián),并通過(guò)開(kāi)源代碼(GitHub鏈接)與Web服務(wù)器技術(shù)服務(wù)體系為蛋白質(zhì)工程領(lǐng)域提供便捷的研究工具。
蛋白質(zhì)突變效應(yīng)預(yù)測(cè)是解碼分子進(jìn)化機(jī)制、優(yōu)化蛋白質(zhì)工程改造的關(guān)鍵物理量。但是,傳統(tǒng)預(yù)測(cè)方法面臨挑戰(zhàn)。一是基于物理力場(chǎng)的計(jì)算方法計(jì)算復(fù)雜度高,難以滿足大規(guī)模篩選需求;二是依賴于實(shí)驗(yàn)數(shù)據(jù)的監(jiān)督學(xué)習(xí)方法易受訓(xùn)練集偏差的影響,使泛化能力受限。
該團(tuán)隊(duì)提出了基于三維結(jié)構(gòu)自監(jiān)督學(xué)習(xí)的深度學(xué)習(xí)框架Pythia。Pythia融合了圖神經(jīng)網(wǎng)絡(luò)與注意力機(jī)制,可直接在蛋白質(zhì)結(jié)構(gòu)中學(xué)習(xí)氨基酸之間的相互作用。這一“零監(jiān)督”預(yù)訓(xùn)練策略突破了傳統(tǒng)方法對(duì)標(biāo)記數(shù)據(jù)的依賴性,捕獲了蛋白質(zhì)折疊過(guò)程中隱藏的物理化學(xué)約束規(guī)律。
相比于傳統(tǒng)的力場(chǎng)函數(shù)方法,Pythia單點(diǎn)突變?chǔ)う預(yù)測(cè)速度提升5個(gè)數(shù)量級(jí),單核計(jì)算速度達(dá)到約50,000個(gè)突變/分鐘。在標(biāo)準(zhǔn)測(cè)試集S2648上,Pythia的Spearman相關(guān)系數(shù)為0.616,Pearson相關(guān)系數(shù)為0.598,性能優(yōu)于現(xiàn)有模型。這一框架為大規(guī)模掃描蛋白質(zhì)序列空間提供了高效工具。在濕實(shí)驗(yàn)驗(yàn)證中,Pythia在不依賴專(zhuān)家篩選的情況下,成功率比基于能量函數(shù)的方法提高了一倍,證明其在實(shí)際應(yīng)用中的可靠性。
Pythia有望進(jìn)一步拓展至蛋白質(zhì)-蛋白質(zhì)相互作用預(yù)測(cè)、多突變協(xié)同效應(yīng)分析等復(fù)雜場(chǎng)景,將助力推動(dòng)計(jì)算驅(qū)動(dòng)蛋白質(zhì)設(shè)計(jì)范式的轉(zhuǎn)型升級(jí)。
研究工作得到國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家自然科學(xué)基金、中國(guó)科學(xué)院戰(zhàn)略性先導(dǎo)科技專(zhuān)項(xiàng)和青年創(chuàng)新促進(jìn)會(huì)會(huì)員項(xiàng)目的支持。
論文鏈接
Pythia模型框架
本文鏈接:科研人員開(kāi)發(fā)出基于結(jié)構(gòu)自監(jiān)督學(xué)習(xí)的深度學(xué)習(xí)框架http://www.sq15.cn/show-12-748-0.html
聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。