化學(xué)是一門研究物質(zhì)組成、結(jié)構(gòu)、性質(zhì)與變化規(guī)律的學(xué)科,其發(fā)展史是人類突破自然表象、揭示物質(zhì)本質(zhì)的歷史。從古代煉金術(shù)士對“點石成金”的癡迷,到現(xiàn)代科學(xué)家操控原子合成新物質(zhì),在好奇心的驅(qū)動下,人類正不斷向著未知前進(jìn)。
近年來,人工智能(AI)技術(shù)迅猛發(fā)展,進(jìn)入千行百業(yè)。當(dāng)AI遇上化學(xué),將催生怎樣的“化學(xué)反應(yīng)”?在化學(xué)領(lǐng)域,AI能處理海量數(shù)據(jù),發(fā)現(xiàn)人類難以察覺的復(fù)雜結(jié)構(gòu),加速科學(xué)研究進(jìn)程,幫助解決復(fù)雜科學(xué)問題。從數(shù)據(jù)獲取到規(guī)律發(fā)現(xiàn),再到技術(shù)應(yīng)用,AI技術(shù)正從根本上重塑化學(xué)研究,為人類開拓未知帶來無限可能。
按下研究“快進(jìn)鍵”
“近年來,面對復(fù)雜的化學(xué)分子結(jié)構(gòu)和海量實驗數(shù)據(jù),傳統(tǒng)的化學(xué)與化工研究方法已經(jīng)開始顯得力不從心。”北京化工大學(xué)教授王丹向科技日報記者介紹,AI可模擬人類的學(xué)習(xí)過程,從大量數(shù)據(jù)中提取有用信息,優(yōu)化決策過程,已在化學(xué)研究領(lǐng)域展現(xiàn)出巨大潛力。
例如,上海交通大學(xué)借助白玉蘭科學(xué)大模型,首次實現(xiàn)化學(xué)大語言模型加速有機合成全流程。該大模型在單步/多步逆合成、產(chǎn)率預(yù)測、選擇性預(yù)測、反應(yīng)優(yōu)化等多個基準(zhǔn)任務(wù)上展現(xiàn)出卓越能力,在加速真實化學(xué)發(fā)現(xiàn)中潛力巨大,有望解決實驗科學(xué)中反復(fù)試錯的難題,為大型語言模型加速有機化學(xué)合成提供了新的研究范式和方法。
在化學(xué)與其他學(xué)科的交叉領(lǐng)域,AI同樣大有可為。“我們主要從事超重力前沿科學(xué)與納米材料產(chǎn)品工程研究。目前,我們課題組正在與計算機領(lǐng)域的專家合作,共同研發(fā)針對特定有機無機納米復(fù)合材料體系的AI智能體原型系統(tǒng)。”王丹說,課題組目前正借助深度學(xué)習(xí)算法進(jìn)行配方模型構(gòu)建。實驗結(jié)果顯示,在給定性能指標(biāo)、成本和環(huán)境影響的約束條件下,AI系統(tǒng)能快速生成滿足需求的材料配方。
“我認(rèn)為AI帶來的最顯著提升主要體現(xiàn)在縮短研發(fā)周期、降低研發(fā)成本、提升發(fā)現(xiàn)概率方面。”大連理工大學(xué)材料科學(xué)與工程學(xué)院副院長董旭峰說,AI已能輔助科學(xué)家進(jìn)行新材料設(shè)計、性能預(yù)測及工藝優(yōu)化等多個研究步驟。例如對于生物醫(yī)用材料,AI可以輔助設(shè)計多孔支架的結(jié)構(gòu),預(yù)測其力學(xué)性能以及生物相容性。AI還可以分析海量的工藝參數(shù)與最終產(chǎn)品性能的數(shù)據(jù),找出最優(yōu)的制備工藝窗口,實現(xiàn)工藝的精準(zhǔn)調(diào)控。
普遍面臨“數(shù)據(jù)之渴”
化學(xué)實驗數(shù)據(jù)質(zhì)量的高低直接影響著AI的預(yù)測和決策能力。然而,當(dāng)前,化學(xué)AI普遍面臨著“數(shù)據(jù)之渴”。
王丹舉例說,化工新材料的研發(fā)涉及實驗、模擬和文獻(xiàn)等多源異構(gòu)數(shù)據(jù),但該領(lǐng)域長期存在數(shù)據(jù)碎片化、語義鴻溝及跨尺度關(guān)聯(lián)不足的問題。高質(zhì)量的數(shù)據(jù)是訓(xùn)練有效AI模型的基礎(chǔ),但化學(xué)數(shù)據(jù)的獲取、整理和標(biāo)準(zhǔn)化仍是一大難題。他建議,構(gòu)建統(tǒng)一的高質(zhì)量數(shù)據(jù)與知識體系,實現(xiàn)材料特征與性能信息的結(jié)構(gòu)化整合與動態(tài)更新。
董旭峰同樣認(rèn)為,數(shù)據(jù)匱乏與數(shù)據(jù)質(zhì)量低是制約AI技術(shù)深入應(yīng)用的重要阻礙。“尤其是生物醫(yī)用材料領(lǐng)域,涉及活體實驗和臨床研究的相關(guān)數(shù)據(jù)不僅數(shù)量少,而且獲取成本極高、噪聲大、標(biāo)準(zhǔn)不統(tǒng)一。”他建議,應(yīng)推動數(shù)據(jù)標(biāo)準(zhǔn)化與共享,建立材料數(shù)據(jù)的標(biāo)準(zhǔn)格式和共享平臺;發(fā)展小樣本學(xué)習(xí)、零樣本學(xué)習(xí)技術(shù),讓AI學(xué)會“舉一反三”;融合多源數(shù)據(jù),將模擬數(shù)據(jù)、文獻(xiàn)數(shù)據(jù)、實驗數(shù)據(jù)甚至失敗的實驗數(shù)據(jù)整合起來。
此外,業(yè)內(nèi)專家普遍認(rèn)為,數(shù)據(jù)驅(qū)動的AI還面臨模型代表性不足、可解釋性不確定等問題,要真正形成實用性強的技術(shù)方法,還需要系統(tǒng)深入研究探索。“作為科學(xué)家,我們不僅需要知道‘是什么’,更需要知道‘為什么’。”董旭峰說。
人機協(xié)同是方向
王丹認(rèn)為,推動AI與化學(xué)研究深度融合,除了要在技術(shù)層面上不斷優(yōu)化,更要在思維層面融合貫通。他分析,當(dāng)前主流AI模型多采用通用算法,缺乏化學(xué)專業(yè)適配性,AI與化學(xué)之間存在“語言不通”的問題。“不難想象,一名化學(xué)專業(yè)的博士和一名計算機專業(yè)博士在接受教育和科研訓(xùn)練過程中,都潛移默化地形成了基于各自學(xué)科特點的思維模式。而思維模式是人類認(rèn)知和決策的核心框架,不同思維模式?jīng)Q定了人們理解世界、解決問題和創(chuàng)造價值的不同方式。”王丹認(rèn)為,要推動“AI+化學(xué)”的跨學(xué)科研究工作,需要匯聚這兩個或更多領(lǐng)域的專家。因此,培養(yǎng)選拔真正具備復(fù)合型知識體系和跨學(xué)科整合能力的創(chuàng)新人才至關(guān)重要。
隨著AI技術(shù)逐漸成熟,其與人類科學(xué)家分工的邊界在哪里?在董旭峰看來,即使未來AI發(fā)展到極高水平,至少在材料研究中,AI仍將面臨不可逾越的邊界,科學(xué)家的核心地位不會改變。
“AI擅長在給定的目標(biāo)和框架下進(jìn)行優(yōu)化和探索,但它無法自發(fā)地提出一個全新的、顛覆性的科學(xué)問題。AI是工具,它沒有價值觀。研究什么、為何而研究,涉及社會需求、倫理等諸多方面。”董旭峰說,真正的科學(xué)突破往往來自將兩個看似不相關(guān)的領(lǐng)域連接起來。這種“遠(yuǎn)距離聯(lián)想”的能力和基于深厚學(xué)識的直覺和審美,目前還是人類的“特權(quán)”。
“AI未來或許會成為一位無比強大的研究助理,它能處理所有煩瑣、復(fù)雜、耗時的計算和數(shù)據(jù)分析工作,將科學(xué)家從重復(fù)性勞動中解放出來。但研究的‘大腦’和‘靈魂’,即提出問題的智慧、定義方向的責(zé)任、進(jìn)行創(chuàng)造性整合的靈感以及承擔(dān)倫理后果的擔(dān)當(dāng),將始終屬于人類科學(xué)家。”董旭峰認(rèn)為,“AI+化學(xué)”的未來發(fā)展方向應(yīng)是人機協(xié)同、各展所長的“科學(xué)家—AI”共生體,而并非互相替代。
(原標(biāo)題:人工智能加速催生“化學(xué)反應(yīng)”——解碼“AI+科研”系列報道之四 )
本文鏈接:人工智能加速催生“化學(xué)反應(yīng)”http://www.sq15.cn/show-11-27884-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點,本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。