(文/陳濟深 編輯/張廣凱)
7月2日,智譜開放平臺產(chǎn)業(yè)生態(tài)大會在上海浦東張江科學會堂舉辦。智譜CEO張鵬在主題演講中發(fā)布了智譜攜手生態(tài)伙伴邁向AGI的兩項最新成果:一是開源發(fā)布新一代通用視覺語言模型GLM-4.1V-Thinking,以推理能力為核心突破,刷新10B級別多模態(tài)模型性能上限;二是MaaS全新上線Agent聚合平臺「應用空間」,全面激活行業(yè)場景中的AI能力,聯(lián)動Z基金啟動Agent開拓者數(shù)億元專項扶持計劃。
值得注意的是,本次智譜發(fā)布的新模型不僅可以輸入一個PPT后自動生成匯報內(nèi)容、演講稿;甚至輸入一段“蘇超”視頻,還能得到一段足球解說……如今的大語言模型不只會看文字,還會看圖片、視頻。
“AGI(通用人工智能)可以分為5個層次:L1是預訓練大模型,L2是對齊、推理,L3是自我學習,L4是自我認知,L5是意識智能。”張鵬指出,視覺推理能力是L3中很重要的能力。
人類的語言能力、視覺能力、語音能力、行動能力、思考能力、推理能力由大腦統(tǒng)一完成,而AI,正在逐一破解這些能力的密碼。
同時,在大會主題演講環(huán)節(jié),智譜高級副總裁吳瑋杰、蒙牛集團副總裁&首席數(shù)智官李琤潔、中國銀聯(lián)金融科技研究院副院長呂旭峰分別就大模型落地實踐做了分享。在panel環(huán)節(jié)中,捏TA創(chuàng)始人胡修涵、AiPPT聯(lián)合創(chuàng)始人王振同、flowith CMO 拐子和張江智薈總經(jīng)理沈玲就bigmodel原生創(chuàng)業(yè)話題進行了觀點碰撞。
智譜再獲10億融資,助力上海打造萬卡集群
今年3月,智譜落戶上海張江,加入“模力社區(qū)”產(chǎn)業(yè)生態(tài)圈。目前,“模力社區(qū)”已經(jīng)集聚將近70家垂類大模型企業(yè),其中25家已經(jīng)通過了安全備案和登記。
7月2日,在智譜開放平臺產(chǎn)業(yè)生態(tài)大會上,浦東創(chuàng)投集團和張江集團聯(lián)合戰(zhàn)略投資智譜,總額10億元。這也是智譜成立以來完成的第十六筆融資。
智譜和上海國資戰(zhàn)略合作簽約現(xiàn)場
就在今年,智譜已經(jīng)完成了5輪融資,資方分別來自杭州,珠海,成都,北京,上海,且均具有國資背景。
同時,由上海儀電牽頭、浦發(fā)集團和智譜共同參與的“算電模”的人工智能新型基礎設施合作啟動,以促進形成“能源+算力+模型+應用”的產(chǎn)業(yè)閉環(huán)。
浦發(fā)集團新產(chǎn)業(yè)發(fā)展部總經(jīng)理孫穎對觀察者網(wǎng)表示,該基礎設施是“電算模”的一體結合的算力基礎設施底座,其中浦發(fā)集團負責電力,上海儀電負責算力,而智譜則提供模型能力。設施將打造一個萬卡集群,在浦發(fā)集團自有的綠電工廠中,通過綠電直連為運算提供能源。
對于打造萬卡集群,孫穎解釋道:“萬卡集群”指的是由上萬張如英偉達的H100這樣的高性能AI計算加速卡組成的超級計算資源池,專門用來訓練和運行大模型。“未來產(chǎn)業(yè)對人工智能算力需求巨大,但萬卡集群規(guī)模的算力稀缺,該設施能為后續(xù)區(qū)域產(chǎn)業(yè)發(fā)展和招商工作提供支撐。”她說。
上海市經(jīng)濟信息化委副主任張宏韜則表示發(fā)展人工智能是上海的重大戰(zhàn)略任務。當前,上海正以國家戰(zhàn)略為牽引,牢牢把握通用人工智能的發(fā)展機遇,夯實算力和語料的基礎能力,推動基礎模型創(chuàng)新發(fā)展,全力打造具身智能、智能終端、AI智能體等爆款產(chǎn)品,乘勢而上,建設人工智能上海高地。
開源模型進軍視頻推理領域
同日,智譜正式發(fā)布并開源視覺語言大模型GLM-4.1V-Thinking,標志著智譜GLM系列視覺模型實現(xiàn)從感知走向認知的關鍵躍遷。
GLM-4.1V-Thinking是一款支持圖像、視頻、文檔等多模態(tài)輸入的通用推理型大模型,專為復雜認知任務設計。它在GLM-4V架構基礎上引入“思維鏈推理機制(Chain-of-Thought Reasoning)”,采用“課程采樣強化學習策略(RLCS, Reinforcement Learning with Curriculum Sampling)”,系統(tǒng)性提升模型跨模態(tài)因果推理能力與穩(wěn)定性。
其輕量版GLM-4.1V-9B-Thinking模型參數(shù)控制在10B級別,在兼顧部署效率的同時實現(xiàn)性能突破。該模型在MMStar、MMMU-Pro、ChartQAPro、OSWorld等28項權威評測中,有23項達成10B級模型的最佳成績,其中18項更是持平或超越參數(shù)量高達72B的Qwen-2.5-VL,充分展現(xiàn)了小體積模型的極限性能潛力。
智譜輕量版GLM-4.1V-9B-Thinking模型跑分成績出眾
而除了傳統(tǒng)的文本,推理,編程任務外,該模型在圖文理解,數(shù)學推理和食品理解上均展示出高度的通用性與穩(wěn)健性:
以AI做高考題為例,由于很多AI目前依然無法識別高考數(shù)學題目中的圖標內(nèi)容,因此在做高考橫評時,AI做數(shù)學卷的范圍往往被限定在了只有文字的題目上,觀察者網(wǎng)編輯在現(xiàn)場體驗后發(fā)現(xiàn),智譜的最新模型對于自帶幾何圖案的題目依然可以順利作答。
而除了識別靜態(tài)圖片外,智譜的最新模型已經(jīng)可以識別動態(tài)視頻的內(nèi)容并進行了理解和推理闡述。
蘇超足球解說:識別復雜動態(tài)圖像,理解事件邏輯
GUI Agent定日程:理解手機/電腦界面,交互操作
看圖買菜:精確識別圖像內(nèi)容,支持復雜推理
目前,GLM-4.1V-9B-Thinking已在Hugging Face與魔搭社區(qū)同步開源。包含兩個模型,分別是GLM-4.1V-9B-Base基座模型,希望能夠幫助更多研究者探索視覺語言模型的能力邊界作;GLM-4.1V-9B-Thinking,具備深度思考和推理能力的模型,正常使用和體驗,均為這一模型。
Huggling Face中國區(qū)負責人王鐵震對觀察者網(wǎng)表示:“智譜模型的性能已經(jīng)超越了去年11月底發(fā)布的GPT-4o,這款90億參數(shù)的模型非常適合筆記本電腦級別的設備運行。”
值得注意的是,本次智譜最新的開源模型憑借90億的參數(shù)量級不僅評測成績優(yōu)于GPT-4o,也和近期發(fā)布的720億參數(shù)阿里千問2.5不分伯仲。
對此王鐵震表示:“這代表中國在開源大模型領域未來達到同樣的性能(智商+情商)所需要的模型尺寸和能耗等成本會越來越低。”
同日,智譜宣布GLM-4.1V-Thinking-Flash API已經(jīng)免費上限智譜開放平臺上線。
智譜對觀察者網(wǎng)表示:在面向科學研究、教育、自主Agent及多模態(tài)助手等更復雜現(xiàn)實世界應用時,補足推理能力的GLM-4.1V-Thinking ,真正解決開放式、信息豐富的千行百業(yè)的場景問題。如長視頻理解、圖像問答、學科解題、文字識別、文檔解讀、Grounding、GUI Agent和代碼生成。
加速商業(yè)化落地
對于大模型的商業(yè)化問題,也是外界一直對于大模型企業(yè)關注的重點。
智譜CEO張鵬對觀察者網(wǎng)表示:智譜GLM大模型日均Token的調(diào)用量在2025年同比增長了近30倍,且日均消耗金額同比增長了52%。
值得注意的是,考慮到智譜早在2023年就開啟了商業(yè)化試水,并披露過2024年期Token調(diào)用量增加了150倍,而在這個基數(shù)上繼續(xù)增長近30倍可見AI商業(yè)化應用的廣泛需求。
而智譜的API價格在2024年多次降價,降價幅度動輒80%-90%。就在今年4月,智譜再次對旗下模型API降價, 其中GLM-4-Plus 降價幅度最大,達到 90%,在API價格“白菜價”的情況下還能獲得日均消耗金額的同比增長。
視覺推理作為帶動大模型向通用多模態(tài)推理邁進的最新一步,大模型企業(yè)也在謀求將這一能力轉(zhuǎn)化為數(shù)字化生產(chǎn)力,尋求商業(yè)化落地。面對B端客戶,大模型企業(yè)一方面提供Agent,打通“最后一公里”。如智譜面向企業(yè)客戶和開發(fā)者,推出了Agent應用空間,企業(yè)無需自建大模型團隊,即可低門檻接入成熟、安全、可控的Agent能力。
如果說大模型是發(fā)動機,Agent則是由發(fā)動機提供動力的汽車、飛機、軍艦,包括任務型Agent、交互型Agent、自主型Agent、協(xié)作型Agent等。
“智能體到底是偏向白領的創(chuàng)意型工作,還是藍領的體力工作,抑或是偏向頂尖研究人員的創(chuàng)意和研究探索型任務更合適?對于這些問題,業(yè)界仍然在不斷探索。”張鵬認為,但只有讓AI工人實現(xiàn)了代替人的一部分基礎性、重復性工作,才能夠?qū)崿F(xiàn)真正的降本增效,這是智能體能力的關鍵點。
長江證券研究指出,視覺推理+工具調(diào)用的深度融合下,教育、醫(yī)療、企服等垂直場景的 Agent落地周期有望提前,看好Agent商業(yè)化元年及投資機遇。
畢馬威中國技術和新經(jīng)濟管理咨詢服務主管合伙人高人伯表示,隨著生成式AI向“自主智能體”演進,AI將不再僅僅是執(zhí)行指令的工具,而是能夠主動規(guī)劃、協(xié)同并完成復雜任務的智能伙伴,這可能會催生全新的商業(yè)模式。
另一方面,大模型企業(yè)也在探索將AI能力落地于智能硬件。
這也經(jīng)歷了技術演進:早期模型很大,只能在云上推理,手機、PC作為客戶端調(diào)用云端的智能能力。而隨著端側(cè)的算力、能源問題逐步解決,端側(cè)也可以部署一定的智能能力,如在汽車、AI眼鏡、AI玩具上可以實現(xiàn)端云結合。
“未來不管是機器人,還是汽車、眼鏡、胸針,都會接入AI的能力。”張鵬認為。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權,不得轉(zhuǎn)載。本文鏈接:智譜再獲10億融資,推出會看“蘇超”的開源新模型http://www.sq15.cn/show-3-148152-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。