東陽光藥AI研發(fā)團隊推出了多個自研創(chuàng)新模型應(yīng)用于藥物分子ADME/T屬性優(yōu)化,已涵蓋PK曲線預(yù)測和CYPs相互作用預(yù)測。近日,團隊發(fā)布了基于多任務(wù)學習策略的藥物透膜/轉(zhuǎn)運預(yù)測模型,內(nèi)部數(shù)據(jù)測試的受試者工作曲線下面積(AUROC)達到0.90,顯著優(yōu)于公共開源模型。
藥物透膜/轉(zhuǎn)運預(yù)測:高成本稀缺數(shù)據(jù)與小樣本學習的典型應(yīng)用場景
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖 1. HEC-Transporters的模型結(jié)構(gòu)。
生物膜和轉(zhuǎn)運體對小分子藥物的口服吸收產(chǎn)生重要影響。具有合適生物膜滲透性的藥物可被腸道充分吸收從而表現(xiàn)出良好的口服生物利用度;藥物與轉(zhuǎn)運體的相互作用影響其藥理活性,若藥物作為底物被轉(zhuǎn)運體外排將導(dǎo)致活性減弱而作為轉(zhuǎn)運體抑制劑則導(dǎo)致活性提升。Caco2細胞系培養(yǎng)是開展藥物腸道吸收與轉(zhuǎn)運體相互作用體外實驗的關(guān)鍵技術(shù),然而其培養(yǎng)周期長、實驗條件敏感且污染風險高,因此測試成本高昂。使用機器學習方法對專有數(shù)據(jù)建模可快速且低成本地預(yù)測藥物與生物膜及轉(zhuǎn)運體的相互作用,從而在早期開展藥代動屬性優(yōu)化。研發(fā)團隊對內(nèi)部Caco2細胞滲透性測試實驗記錄進行了數(shù)據(jù)抽提及標準化,共獲得包含膜滲透、轉(zhuǎn)運體底物、轉(zhuǎn)運體抑制三個任務(wù)在內(nèi)的有效數(shù)據(jù),為創(chuàng)新模型構(gòu)建提供了高質(zhì)量的專有訓練、驗證數(shù)據(jù)集。
多任務(wù)學習策略:挖掘通用任務(wù)特征,實現(xiàn)小樣本泛化建模
HEC-Transporters整體架構(gòu)如圖1所示,該模型創(chuàng)新性在于使用多任務(wù)學習策略進行數(shù)據(jù)及模型層面的透膜與轉(zhuǎn)運任務(wù)聯(lián)合建模。首先,數(shù)據(jù)被劃分為共享型與特異型,前者樣本分子約占總樣本的80%,在三個任務(wù)中均出現(xiàn),因而用于訓練一個通用的消息傳遞網(wǎng)絡(luò)以捕捉分子與生物膜作用的共同結(jié)構(gòu)特征;后者則在各自任務(wù)中特異出現(xiàn),因此分別用于訓練獨立的前饋神經(jīng)網(wǎng)絡(luò)以提升模型在專有任務(wù)上的表現(xiàn)。研發(fā)團隊將HEC-Transporters與當前先進的自動機器學習建模方法進行了比較研究,內(nèi)部數(shù)據(jù)集基準測試結(jié)果如圖2所示:多任務(wù)學習模型平均AUC高達0.90,較單任務(wù)模型提升0.33,較基線模型提升0.19;準確率結(jié)果顯示,多任務(wù)策略在膜滲透性任務(wù)上準確率最高,達到93%,而對轉(zhuǎn)運體底物預(yù)測提升效果最佳,較單任務(wù)模型提升18.0%,較自動化機器學習模型提升12.2%。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 圖 2.HEC-Transporters的模型性能。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (A)曲線下面積;(B)準確率。
技術(shù)創(chuàng)新與應(yīng)用價值
HEC-Transporters是國際上首款使用多任務(wù)學習策略建模藥物透膜/轉(zhuǎn)運的預(yù)測系統(tǒng),其不僅使用參數(shù)共享的消息傳遞網(wǎng)絡(luò)捕捉通用任務(wù)特征以提升性能,而且緩解了專有任務(wù)數(shù)據(jù)量較小的建模局限,相較于自動機器學習和單任務(wù)網(wǎng)絡(luò)在內(nèi)部數(shù)據(jù)上表現(xiàn)出較高的泛化性能。該模型目前已集成于團隊自研ADME/T預(yù)測工作流之中,為東陽光藥早期藥物研發(fā)提供全流程的藥代動力學性質(zhì)優(yōu)化。
研發(fā)范式革新:自2023年實施AI+戰(zhàn)略以來,東陽光藥已構(gòu)建覆蓋靶點預(yù)測、苗頭化合物篩選、先導(dǎo)化合物優(yōu)化、PK建模的全流程AI研發(fā)體系。通過AI賦能研發(fā),既降低了新藥開發(fā)成本,又以技術(shù)協(xié)同推動行業(yè)整體效能提升,助力中國醫(yī)藥產(chǎn)業(yè)在全球競爭中搶占創(chuàng)新制高點。
關(guān)于東陽光藥
東陽光藥創(chuàng)立于2003年,是一家以自主研發(fā)為驅(qū)動、植根中國、面向世界的綜合型制藥公司。東陽光藥為全球患者提供創(chuàng)新、優(yōu)質(zhì)及可負擔的藥物,以成為世界一流的制藥公司為企業(yè)愿景。20多年來,公司堅持“創(chuàng)新”和“國際化”發(fā)展戰(zhàn)略,已建成國內(nèi)領(lǐng)先的藥物研發(fā)平臺、符合國際標準的生產(chǎn)設(shè)施和覆蓋全球的銷售網(wǎng)絡(luò)。公司戰(zhàn)略性聚焦兒童藥、感染、慢病及腫瘤等治療領(lǐng)域,在全球擁有150款獲批藥物,超過100款在研藥物,包括近50款一類創(chuàng)新藥,逐步發(fā)展成為中國生物醫(yī)藥領(lǐng)軍企業(yè)之一。公司連續(xù)7年入選由藥智網(wǎng)發(fā)布的“中國藥品研發(fā)綜合實力排行榜”TOP20,蟬聯(lián)“2023中國醫(yī)藥創(chuàng)新企業(yè)100強”第一梯級,其中專利數(shù)位居“2022年全球生物醫(yī)藥產(chǎn)業(yè)發(fā)明專利排行榜TOP 100”全球第44位,中國第4位。根據(jù)弗若斯特沙利文報告,以2014年1月1日至2023年12月31日在中國公布的專利數(shù)量及授權(quán)專利公告數(shù)量統(tǒng)計,東陽光藥在中國制藥公司中排名第一。
本文鏈接:東陽光藥AI研發(fā)團隊發(fā)布HEC-Transporters模型,為早期藥物研發(fā)提供全流程的藥代動力學性質(zhì)優(yōu)化http://www.sq15.cn/show-3-144055-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。