智譜再獲10億融資，推出會看“蘇超”的開源新模型

2025-07-04 10:35:14 來源：觀察者網(wǎng)

觀看：41

（文/陳濟深編輯/張廣凱）

7月2日，智譜開放平臺產(chǎn)業(yè)生態(tài)大會在上海浦東張江科學會堂舉辦。智譜CEO張鵬在主題演講中發(fā)布了智譜攜手生態(tài)伙伴邁向AGI的兩項最新成果：一是開源發(fā)布新一代通用視覺語言模型GLM-4.1V-Thinking，以推理能力為核心突破，刷新10B級別多模態(tài)模型性能上限；二是MaaS全新上線Agent聚合平臺「應用空間」，全面激活行業(yè)場景中的AI能力，聯(lián)動Z基金啟動Agent開拓者數(shù)億元專項扶持計劃。

值得注意的是，本次智譜發(fā)布的新模型不僅可以輸入一個PPT后自動生成匯報內(nèi)容、演講稿；甚至輸入一段“蘇超”視頻，還能得到一段足球解說……如今的大語言模型不只會看文字，還會看圖片、視頻。

“AGI（通用人工智能）可以分為5個層次：L1是預訓練大模型，L2是對齊、推理，L3是自我學習，L4是自我認知，L5是意識智能。”張鵬指出，視覺推理能力是L3中很重要的能力。

人類的語言能力、視覺能力、語音能力、行動能力、思考能力、推理能力由大腦統(tǒng)一完成，而AI，正在逐一破解這些能力的密碼。

同時，在大會主題演講環(huán)節(jié)，智譜高級副總裁吳瑋杰、蒙牛集團副總裁&首席數(shù)智官李琤潔、中國銀聯(lián)金融科技研究院副院長呂旭峰分別就大模型落地實踐做了分享。在panel環(huán)節(jié)中，捏TA創(chuàng)始人胡修涵、AiPPT聯(lián)合創(chuàng)始人王振同、flowith CMO 拐子和張江智薈總經(jīng)理沈玲就bigmodel原生創(chuàng)業(yè)話題進行了觀點碰撞。

智譜再獲10億融資，助力上海打造萬卡集群

今年3月，智譜落戶上海張江，加入“模力社區(qū)”產(chǎn)業(yè)生態(tài)圈。目前，“模力社區(qū)”已經(jīng)集聚將近70家垂類大模型企業(yè)，其中25家已經(jīng)通過了安全備案和登記。

7月2日，在智譜開放平臺產(chǎn)業(yè)生態(tài)大會上，浦東創(chuàng)投集團和張江集團聯(lián)合戰(zhàn)略投資智譜，總額10億元。這也是智譜成立以來完成的第十六筆融資。

智譜和上海國資戰(zhàn)略合作簽約現(xiàn)場

就在今年，智譜已經(jīng)完成了5輪融資，資方分別來自杭州，珠海，成都，北京，上海，且均具有國資背景。

同時，由上海儀電牽頭、浦發(fā)集團和智譜共同參與的“算電模”的人工智能新型基礎設施合作啟動，以促進形成“能源+算力+模型+應用”的產(chǎn)業(yè)閉環(huán)。

浦發(fā)集團新產(chǎn)業(yè)發(fā)展部總經(jīng)理孫穎對觀察者網(wǎng)表示，該基礎設施是“電算模”的一體結合的算力基礎設施底座，其中浦發(fā)集團負責電力，上海儀電負責算力，而智譜則提供模型能力。設施將打造一個萬卡集群，在浦發(fā)集團自有的綠電工廠中，通過綠電直連為運算提供能源。

對于打造萬卡集群，孫穎解釋道：“萬卡集群”指的是由上萬張如英偉達的H100這樣的高性能AI計算加速卡組成的超級計算資源池，專門用來訓練和運行大模型。“未來產(chǎn)業(yè)對人工智能算力需求巨大，但萬卡集群規(guī)模的算力稀缺，該設施能為后續(xù)區(qū)域產(chǎn)業(yè)發(fā)展和招商工作提供支撐。”她說。

上海市經(jīng)濟信息化委副主任張宏韜則表示發(fā)展人工智能是上海的重大戰(zhàn)略任務。當前，上海正以國家戰(zhàn)略為牽引，牢牢把握通用人工智能的發(fā)展機遇，夯實算力和語料的基礎能力，推動基礎模型創(chuàng)新發(fā)展，全力打造具身智能、智能終端、AI智能體等爆款產(chǎn)品，乘勢而上，建設人工智能上海高地。

開源模型進軍視頻推理領域

同日，智譜正式發(fā)布并開源視覺語言大模型GLM-4.1V-Thinking，標志著智譜GLM系列視覺模型實現(xiàn)從感知走向認知的關鍵躍遷。

GLM-4.1V-Thinking是一款支持圖像、視頻、文檔等多模態(tài)輸入的通用推理型大模型，專為復雜認知任務設計。它在GLM-4V架構基礎上引入“思維鏈推理機制（Chain-of-Thought Reasoning）”，采用“課程采樣強化學習策略（RLCS, Reinforcement Learning with Curriculum Sampling）”，系統(tǒng)性提升模型跨模態(tài)因果推理能力與穩(wěn)定性。

其輕量版GLM-4.1V-9B-Thinking模型參數(shù)控制在10B級別，在兼顧部署效率的同時實現(xiàn)性能突破。該模型在MMStar、MMMU-Pro、ChartQAPro、OSWorld等28項權威評測中，有23項達成10B級模型的最佳成績，其中18項更是持平或超越參數(shù)量高達72B的Qwen-2.5-VL，充分展現(xiàn)了小體積模型的極限性能潛力。

智譜輕量版GLM-4.1V-9B-Thinking模型跑分成績出眾

而除了傳統(tǒng)的文本，推理，編程任務外，該模型在圖文理解，數(shù)學推理和食品理解上均展示出高度的通用性與穩(wěn)健性：

以AI做高考題為例，由于很多AI目前依然無法識別高考數(shù)學題目中的圖標內(nèi)容，因此在做高考橫評時，AI做數(shù)學卷的范圍往往被限定在了只有文字的題目上，觀察者網(wǎng)編輯在現(xiàn)場體驗后發(fā)現(xiàn)，智譜的最新模型對于自帶幾何圖案的題目依然可以順利作答。

而除了識別靜態(tài)圖片外，智譜的最新模型已經(jīng)可以識別動態(tài)視頻的內(nèi)容并進行了理解和推理闡述。

蘇超足球解說：識別復雜動態(tài)圖像，理解事件邏輯

GUI Agent定日程：理解手機/電腦界面，交互操作

看圖買菜：精確識別圖像內(nèi)容，支持復雜推理

目前，GLM-4.1V-9B-Thinking已在Hugging Face與魔搭社區(qū)同步開源。包含兩個模型，分別是GLM-4.1V-9B-Base基座模型，希望能夠幫助更多研究者探索視覺語言模型的能力邊界作；GLM-4.1V-9B-Thinking，具備深度思考和推理能力的模型，正常使用和體驗，均為這一模型。

Huggling Face中國區(qū)負責人王鐵震對觀察者網(wǎng)表示：“智譜模型的性能已經(jīng)超越了去年11月底發(fā)布的GPT-4o，這款90億參數(shù)的模型非常適合筆記本電腦級別的設備運行。”

值得注意的是，本次智譜最新的開源模型憑借90億的參數(shù)量級不僅評測成績優(yōu)于GPT-4o，也和近期發(fā)布的720億參數(shù)阿里千問2.5不分伯仲。

對此王鐵震表示：“這代表中國在開源大模型領域未來達到同樣的性能（智商+情商）所需要的模型尺寸和能耗等成本會越來越低。”

同日，智譜宣布GLM-4.1V-Thinking-Flash API已經(jīng)免費上限智譜開放平臺上線。

智譜對觀察者網(wǎng)表示：在面向科學研究、教育、自主Agent及多模態(tài)助手等更復雜現(xiàn)實世界應用時，補足推理能力的GLM-4.1V-Thinking ，真正解決開放式、信息豐富的千行百業(yè)的場景問題。如長視頻理解、圖像問答、學科解題、文字識別、文檔解讀、Grounding、GUI Agent和代碼生成。

加速商業(yè)化落地

對于大模型的商業(yè)化問題，也是外界一直對于大模型企業(yè)關注的重點。

智譜CEO張鵬對觀察者網(wǎng)表示：智譜GLM大模型日均Token的調(diào)用量在2025年同比增長了近30倍，且日均消耗金額同比增長了52%。

值得注意的是，考慮到智譜早在2023年就開啟了商業(yè)化試水，并披露過2024年期Token調(diào)用量增加了150倍，而在這個基數(shù)上繼續(xù)增長近30倍可見AI商業(yè)化應用的廣泛需求。

而智譜的API價格在2024年多次降價，降價幅度動輒80%-90%。就在今年4月，智譜再次對旗下模型API降價，其中GLM-4-Plus 降價幅度最大，達到 90%，在API價格“白菜價”的情況下還能獲得日均消耗金額的同比增長。

視覺推理作為帶動大模型向通用多模態(tài)推理邁進的最新一步，大模型企業(yè)也在謀求將這一能力轉(zhuǎn)化為數(shù)字化生產(chǎn)力，尋求商業(yè)化落地。

面對B端客戶，大模型企業(yè)一方面提供Agent，打通“最后一公里”。如智譜面向企業(yè)客戶和開發(fā)者，推出了Agent應用空間，企業(yè)無需自建大模型團隊，即可低門檻接入成熟、安全、可控的Agent能力。

如果說大模型是發(fā)動機，Agent則是由發(fā)動機提供動力的汽車、飛機、軍艦，包括任務型Agent、交互型Agent、自主型Agent、協(xié)作型Agent等。

“智能體到底是偏向白領的創(chuàng)意型工作，還是藍領的體力工作，抑或是偏向頂尖研究人員的創(chuàng)意和研究探索型任務更合適？對于這些問題，業(yè)界仍然在不斷探索。”張鵬認為，但只有讓AI工人實現(xiàn)了代替人的一部分基礎性、重復性工作，才能夠?qū)崿F(xiàn)真正的降本增效，這是智能體能力的關鍵點。

長江證券研究指出，視覺推理+工具調(diào)用的深度融合下，教育、醫(yī)療、企服等垂直場景的 Agent落地周期有望提前，看好Agent商業(yè)化元年及投資機遇。

畢馬威中國技術和新經(jīng)濟管理咨詢服務主管合伙人高人伯表示，隨著生成式AI向“自主智能體”演進，AI將不再僅僅是執(zhí)行指令的工具，而是能夠主動規(guī)劃、協(xié)同并完成復雜任務的智能伙伴，這可能會催生全新的商業(yè)模式。

另一方面，大模型企業(yè)也在探索將AI能力落地于智能硬件。

這也經(jīng)歷了技術演進：早期模型很大，只能在云上推理，手機、PC作為客戶端調(diào)用云端的智能能力。而隨著端側(cè)的算力、能源問題逐步解決，端側(cè)也可以部署一定的智能能力，如在汽車、AI眼鏡、AI玩具上可以實現(xiàn)端云結合。

“未來不管是機器人，還是汽車、眼鏡、胸針，都會接入AI的能力。”張鵬認為。

本文系觀察者網(wǎng)獨家稿件，未經(jīng)授權，不得轉(zhuǎn)載。

本文鏈接：智譜再獲10億融資，推出會看“蘇超”的開源新模型http://www.sq15.cn/show-3-148152-0.html

聲明：本網(wǎng)站為非營利性網(wǎng)站，本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻，不代表本站觀點，本站不承擔任何法律責任。天上不會到餡餅，請大家謹防詐騙！若有侵權等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。

上一篇：茶顏悅色回應“在辣醬中吃出玻璃”：可能性為零，正內(nèi)部核查

下一篇：泡泡瑪特回應“5.8億倫敦買樓”：該消息不實！

中文字幕亚洲欧美一区二区三区_亚洲精品菠萝久久久久久久_日本成人免费视频_狠狠躁少妇一区二区三区_国产精品中文字幕久久久_国产乱子伦农村叉叉叉_麻豆tv免费在线观看_av在线这里只有精品_色吧亚洲视频_嫩草影院一二三

智譜再獲10億融資，推出會看“蘇超”的開源新模型

熱門資訊

推薦資訊

財經(jīng)最熱文章