要和歷史對話,并不是一件容易的事情,要梳理一個文明的脈絡,更是難上加難。
考古學家們在不同的遺址挖掘出歷史的碎片,結合邏輯推理和諸多史料驗證,慢慢拼湊出當時的生活和文化場景;古文字學家們對每一片甲骨都十分珍視,不惜耗費數年時間,推測出某一個圖案所代表的文字,進而去閱讀古人的思想;歷史學家們與古籍、方志輿圖為伴,在晦澀的文言文中還原歷史事件的真相……
在世界文明歷史中,中華文明是非常獨特的存在——四大文明中,唯有中華文明始終保持完整傳承,以開放包容、多元融合的特點延續至今。在一代代學者們接力努力下,中華文明上下五千年的歷史被清晰還原,學齡前的孩子也能輕松說出歷史上的代表性事件。
但即便如此,依然有著很多謎題等待破解。和氏璧去了哪?樓蘭古國為何突然消失?建文帝是否真的命喪大火?……而更多疑點,則存在于中華文明的源頭。由于時間久遠、考古和文獻資料的不足,如夏朝存在與否等問題,至今仍有爭議。
“我們希望能夠通過大模型打破學科壁壘,讓不同領域的學者圍繞一條邏輯主線,把中國歷史文明的遺珠穿成串,形成完整的中華文明故事?!睆偷┐髮W校長助理、上海科學智能研究院(以下簡稱上智院)理事長、上海創智學院副院長吳力波告訴《中國科學報》。
基于此,全球首個聚焦早期中華文明議題的人工智能模型“早期中華文明多模態大模型”應運而生。該大模型由復旦大學、上智院與上海創智學院聯合研發,在2025世界人工智能大會期間正式發布。
一款“很懂”人文社科的AI工具
如果說幾年前人們還在驚訝于一些高校中文系會設置計算機專業,在AI快速發展的當下,越來越多人文社會科學領域的學者開始主動擁抱新技術,探索將AI與自己的研究相結合。
“在得知我們要做大模型時,復旦很多人文社科的老師都和我交流過,討論后續合作的可能?!睆偷┐髮W特聘教授、上智院院長漆遠告訴《中國科學報》。
早期中華文明多模態大模型正是為人文社科學者“定制”的AI幫手,不僅懂人文社會科學的研究體系,具有強大的跨模態關聯分析能力,而且兼具極速檢索、智能識讀、多語言精準翻譯等功能,可幫助學者們顯著提升研究效率。
作為項目技術負責人,復旦大學人工智能創新與產業研究院研究員、上智院AI科學家朱思語介紹說,模型率先構建全球最大中華文明多模態數據庫,深度整合了考古實物資料、歷史傳世文獻、古文字數據、歷史地理信息、人類學基因數據等權威異構數據源,實現跨模態、跨學科、跨時空信息的對齊與關聯。
為考察大模型對早期中華文明的理解程度,項目團隊針對性設計了早期中華文明測評集。該評測體系采用“學科領域×問題難度×研究場景”的三維度分層框架,涵蓋與早期中國文明相關的多個人文社科重點領域,體系涵蓋基礎史實記憶、證據整合與關聯分析、學術爭議點的批判性論證等不同梯度,同時緊密貼合實際研究需求,適配多種研究任務。
“整體體系匯聚超10000個高質量問題,確保評測既系統全面又精準有效,能夠真實反映人文研究的多元場景與復雜需求。”吳力波強調,“這些問題主要來自于青年人文社科學者,都是他們所在領域比較重要的關鍵問題?!?span style="display:none">Da0速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM
同時,為方便用戶使用,項目團隊充分融合人文社會科學特有的研究方法與知識生產機制,構建了一個面向多學科領域的早期中華文明AI智能體應用平臺。智能體由高效檢索、精準翻譯、智能識讀、事實呈現、特征描述、史料信度考據、深度分析推理七大引擎驅動,支持多步驟推理與復雜任務規劃,并嚴格確保所有模型輸出基于可靠知識來源與完整證據鏈,所有結果均可追溯與驗證。
以《禹貢》“導河積石”記載的研究為例,大模型能夠通過整合地理空間智能分析、文獻智能檢索與對比、古文字智能識讀、考古遺存智能關聯等AI工具,幫助學者們開展黃河探源以及夏代治水工程推演方面的研究。
覆蓋眾多珍貴史料
早期中華文明多模態大模型之所以能夠理解人文社會科學領域學者的需求,離不開大量高質量數據的“喂養”。
針對“中華早期文明”這一宏大主題,大模型數據庫納入了100TB專業化語料、5萬條SFT數據,系統覆蓋考古學、文物學、中國古代史、歷史地理學、歷史文獻學、中國古典文獻學、漢語言文字學、中國古代文學、中國少數民族語言文學等學科,并整合了甲骨金文、方志輿圖等珍稀史料。
這些數據中既包含通用的學科領域材料,也納入了復旦大學所特有的資料。“我們通過和復旦深度合作,把學校優勢人文社科的知識體系與學術積淀投入到大模型的開發中。”朱思語表示。
目前,開發團隊正在進行安全性評估,判斷這些“只此一家”的珍貴數據是否可以對外公布?!拔覀儠掷m進行數據平臺的運營工作,在合理合規的前提下,把數據的開放性做得更好?!睆偷┐髮W人工智能創新與產業研究院副院長、上智院副院長程遠透露,“我們近期會發布早期中華文明評測集,并進一步研發能夠整合多模態海量數據的早期中華文明多模態生成/理解大模型?!?span style="display:none">Da0速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM
人文社科學者深度參與
“當我們把所有的考古報告集合在一起以后,發現人群流動、文化交流,甚至物質交流之間的關聯超乎想象。如果僅用單一的歷史學或傳統考古學方法,可能都無法解決?!睆偷┐髮W中國歷史地理研究所所長張曉虹如是形容使用初體驗。
早期中華文明多模態大模型能力背后,是人文洞見與理工技術的深度交叉融合。
項目組由相關領域權威專家組成的指導委員會領銜,統籌指導由AI科學家、專業領域學者和工程技術人員組成的多學科協作團隊,形成結構完善、分工明確的合作研發格局。
吳力波解釋道:“業界有一些專門的‘金標準’用于評測大模型能力。人文領域的大模型尚缺乏公認的標準,必須由領域內的專家參與開發,從而制定標準、幫助大模型不斷訓練并提升能力?!?span style="display:none">Da0速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM
研發過程中,專家委員會負責總體學術把關與方向指導,AI科學家專注于算法模型設計與技術攻關,領域專家參與數據體系構建與知識審核,工程團隊負責系統開發與平臺搭建。多維協同、優勢互補,推動實現“以人文精神引領智能開發”的新型合作模式。
此外,項目面向在校碩博生廣泛招募參與者,建立專業化的知識標注與數據構建團隊,以“學術梯隊”建設保障數據質量?!斑@不僅夯實了大模型的專業知識底座,也為相關學科的研究生提供參與重大科研項目的實踐平臺,培養新一代‘人文+智能’復合型創新人才?!眳橇Σㄖ赋?。
讓“冷板凳”變熱
值得一提的是,早期中華文明多模態大模型是復旦大學“AI for Humanity”理念的重要實踐。
“我們希望能夠通過大模型,為中華文明的傳承與弘揚提供更具前瞻性和系統性的技術支撐,同時探索以數字智能推動人類文明研究范式轉型的可能路徑?!眳橇Σㄕf道。
陳寅恪、季羨林、裘錫圭......這些鼎鼎有名的人文社會科學大家,無一不是甘坐冷板凳,能夠沉下心、耗費數十年完成一系列鴻篇巨制。在吳力波看來,早期中華文明多模態大模型可以為人文社科學者的研究插上“最強翅膀”,進而更好地發現單一學科難以察覺的突破點,大幅提高研究效率。
“由此,‘冷板凳’可能會變成‘熱板凳’,‘十年磨一劍’變成‘十月磨一劍’,中華文明源頭的迷霧能被加速吹散。”吳力波表示,“此外,也會有更多‘通才’出現,他們能夠以跨學科的視野,開辟新的研究方向。”
值得一提的是,在這場文化與智能的對話中,已經出現一批站在人文和科技交匯點上的范式創新者。劉釗、張曉虹、陸建松、高晞、張夢翰、文少卿......復旦大學的人文領域學者們,正在用AI的力量講述新時代的中華故事。
“通過多模態的數據分析和智能建模,不僅能讓早期的歷史重新煥發光彩,也讓我們進一步深入認識中華早期文明密碼中蘊含的深層意義?!睆偷┐髮W特聘教授、出土文獻與古文字研究中心主任劉釗說道。
而復旦大學和上智院的AI科學家團隊,也未停下探索的步伐?!拔覀兡壳暗闹饕蝿帐前言缙谥腥A文明多模態大模型做好、做深,未來也會擴展到其他文明以及人文學科中。”漆遠表示。
本文鏈接:用AI溯源歷史,早期中華文明多模態大模型發布http://www.sq15.cn/show-11-24222-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
下一篇: 沉寂八年不曾放棄,他們用“聲音”看見沉船