世人皆知算力、算法、數(shù)據(jù)是人工智能大模型的三駕馬車,驅(qū)動(dòng)AI奔向新紀(jì)元。在這幅圖景里,拉車的是“三馬”,狂奔的是AI大模型,那么“車”是誰(shuí)?
好問題。但先不急揭曉謎底,我們先來(lái)看一條不久前的新聞。
套“三馬”的車:AI機(jī)器學(xué)習(xí)平臺(tái)
今年5月,騰訊混元大模型星脈網(wǎng)絡(luò)技術(shù)團(tuán)隊(duì)針對(duì)DeepSeek開源的DeepEP通信框架進(jìn)行深度優(yōu)化,使其在RoCE、IB等多種網(wǎng)絡(luò)環(huán)境下均實(shí)現(xiàn)顯著性能提升。對(duì)此,DeepSeek公開致謝,稱這是一次“huge speedup”(巨大的加速)代碼貢獻(xiàn)。之后,騰訊團(tuán)隊(duì)也將這一技術(shù)開源。
這是開源社區(qū)一次友好的開放共建、互動(dòng)共享。從這件事可以看到騰訊團(tuán)隊(duì)在大模型技術(shù)方面的兩點(diǎn)堅(jiān)持:一是創(chuàng)新,二是關(guān)注技術(shù)的場(chǎng)景應(yīng)用。
這兩點(diǎn),也恰恰和我們的謎底有關(guān)系。星脈網(wǎng)絡(luò)是騰訊Angel機(jī)器學(xué)習(xí)平臺(tái)這個(gè)“超級(jí)流水線”上關(guān)鍵一環(huán),它的使命是讓訓(xùn)練模型的成千上萬(wàn)張算力卡能夠“集團(tuán)作戰(zhàn)”,以便算力集群能夠更好地協(xié)作,高效處理海量數(shù)據(jù),支持算法落地。
看到這里,已經(jīng)有人找到了前面問題的答案:這輛“馬車”,就是AI機(jī)器學(xué)習(xí)平臺(tái),它包含了模型訓(xùn)練和推理一整套流程。從開發(fā)者的角度來(lái)看,能夠同時(shí)把算力、算法、數(shù)據(jù)這三匹“駿馬”整合在一起的,也只有AI機(jī)器學(xué)習(xí)平臺(tái)這一大模型“工廠”。
如今,在算力、算法和數(shù)據(jù)之外,AI機(jī)器學(xué)習(xí)平臺(tái)正在成為各基礎(chǔ)大模型“大廠”越來(lái)越重視的新基建。
AI工業(yè)化時(shí)代的核心“新基建”
作為大模型訓(xùn)推的“工廠”,AI機(jī)器學(xué)習(xí)平臺(tái)在大模型出現(xiàn)之前,人們習(xí)慣稱之為“深度學(xué)習(xí)框架”;現(xiàn)在,人們更愿意叫它“機(jī)器學(xué)習(xí)平臺(tái)”或“訓(xùn)練/推理平臺(tái)”。就其功能性而言,AI機(jī)器學(xué)習(xí)平臺(tái)更像是一片沃土和工廠,離開了它,開發(fā)者將“難為無(wú)米之炊”。
以英偉達(dá)DGX1計(jì)算系統(tǒng)為例,它不僅是一臺(tái)高性能計(jì)算機(jī),更是集成GPU 集群與深度學(xué)習(xí)框架的軟硬一體平臺(tái)。如果不是預(yù)安裝了經(jīng)過深度優(yōu)化的CUDA 8.0、cuDNN 5.1、TensorFlow/PyTorch 框架以及 DIGITS 可視化訓(xùn)練工具,恐怕它也不會(huì)如此“引無(wú)數(shù)英雄競(jìng)折腰”。
也正因此,機(jī)器學(xué)習(xí)平臺(tái)幾乎成了基礎(chǔ)大模型廠商的標(biāo)配。可以看到在國(guó)內(nèi),阿里通義有PAI,百度文心有飛槳,騰訊有Angel,等等。
機(jī)器學(xué)習(xí)平臺(tái)為何如此受青睞?騰訊機(jī)器學(xué)習(xí)平臺(tái)部總經(jīng)理陳鵬說(shuō),提升業(yè)務(wù)效率、促進(jìn)團(tuán)隊(duì)協(xié)作、優(yōu)化資源管理等等,都可以成為“大廠”蓄力發(fā)育機(jī)器學(xué)習(xí)平臺(tái)的理由,但它最重要的角色,“我認(rèn)為是AI‘工業(yè)化’的核心基礎(chǔ)設(shè)施”。
陳鵬以騰訊Angel機(jī)器學(xué)習(xí)平臺(tái)為例談道,作為AI工業(yè)化的基礎(chǔ)設(shè)施,Angel機(jī)器學(xué)習(xí)平臺(tái)對(duì)內(nèi)驅(qū)動(dòng)全系列混元大模型(從0.5B至萬(wàn)億參數(shù))的迭代升級(jí),涵蓋語(yǔ)言模型、多模態(tài)生成模型等,支撐其應(yīng)用于微信、廣告推薦等業(yè)務(wù)場(chǎng)景;對(duì)外,Angel機(jī)器學(xué)習(xí)平臺(tái)支撐各型號(hào)混元大模型通過騰訊云服務(wù)30萬(wàn)企業(yè)客戶,覆蓋金融風(fēng)控、廣告投放、工業(yè)質(zhì)檢等場(chǎng)景。同時(shí),Angel平臺(tái)支持異構(gòu)芯片混合計(jì)算,可靈活調(diào)度不同芯片算力,推動(dòng)自主可控技術(shù)落地。
騰訊混元T1的迭代開發(fā)離不開Angel機(jī)器學(xué)習(xí)平臺(tái)。
陳鵬介紹說(shuō),在大模型訓(xùn)練任務(wù)中,機(jī)器學(xué)習(xí)平臺(tái)就是“工廠超級(jí)流水線”。在這條流水線上,共性技術(shù)被提煉、流程要素被整合;模型從訓(xùn)練到部署,質(zhì)量可控、效率翻倍,真正從“實(shí)驗(yàn)室研發(fā)”轉(zhuǎn)化為產(chǎn)業(yè)生產(chǎn)力。
騰訊Angel平臺(tái)的技術(shù)價(jià)值不僅體現(xiàn)于混元大模型的成功落地,更通過開源生態(tài)與云計(jì)算輸出,推動(dòng)千行百業(yè)智能化升級(jí),成為AI工業(yè)化時(shí)代的核心“新基建”。
開發(fā)者共同成長(zhǎng)的“數(shù)字家園”
“大廠”重視AI訓(xùn)練平臺(tái)的建設(shè),當(dāng)然還有打造開發(fā)者生態(tài)的愿望在其中。陳鵬說(shuō),機(jī)器學(xué)習(xí)平臺(tái)對(duì)匯聚開發(fā)者、打造開源社區(qū)的價(jià)值很大,其作用遠(yuǎn)超技術(shù)工具本身。
開發(fā)者生態(tài)對(duì)于大模型技術(shù)落地而言,比機(jī)器學(xué)習(xí)平臺(tái)本身更重要,其中道理很簡(jiǎn)單:機(jī)器學(xué)習(xí)平臺(tái)可以用一支百人量級(jí)的隊(duì)伍來(lái)構(gòu)建,但生態(tài)需要幾萬(wàn)、幾十萬(wàn)乃至上百萬(wàn)的人參與才可以。對(duì)于大模型等AI技術(shù)應(yīng)用而言,市場(chǎng)只會(huì)為解決應(yīng)用問題買單,不會(huì)為訓(xùn)練平臺(tái)買單。
作為國(guó)內(nèi)首個(gè)從LF AI基金會(huì)(系Linux基金會(huì)旗下面向AI領(lǐng)域的頂級(jí)基金會(huì))畢業(yè)的開源項(xiàng)目,騰訊Angel平臺(tái)的技術(shù)文檔和 API 設(shè)計(jì)遵循國(guó)際標(biāo)準(zhǔn),吸引華為、小米等百余家企業(yè)和機(jī)構(gòu)參與生態(tài)建設(shè),目前累計(jì)貢獻(xiàn)者已超1.8萬(wàn)人,其中超過 20% 的社區(qū)貢獻(xiàn)者來(lái)自非中文地區(qū)。
AI機(jī)器學(xué)習(xí)平臺(tái)為數(shù)據(jù)工程師、算法工程師、業(yè)務(wù)研發(fā)工程師等不同角色提供了統(tǒng)一的工作平臺(tái)和流程。各方可以在平臺(tái)上協(xié)作,實(shí)現(xiàn)數(shù)據(jù)、模型、代碼等資源的共享和管理,提高團(tuán)隊(duì)協(xié)作效率。同時(shí),機(jī)器學(xué)習(xí)平臺(tái)還提供可視化界面和統(tǒng)一接口,方便不同專業(yè)背景的人員理解和使用,降低溝通成本。
陳鵬表示,未來(lái)隨著AI 工業(yè)化加速,AI機(jī)器學(xué)平臺(tái)將進(jìn)一步成為技術(shù)民主化的基礎(chǔ)設(shè)施,推動(dòng)全球開發(fā)者共建普惠的AI落地和應(yīng)用。
“第一梯隊(duì)”的戰(zhàn)略堅(jiān)守
在剛剛落下帷幕不久的世界人工智能大會(huì)(WAIC)上,騰訊向世界展示了其加速推動(dòng)AI從技術(shù)突破邁向場(chǎng)景落地、打造真正“好用的AI”的實(shí)踐與愿景。
在AWAIC騰訊論壇上的信息顯示,騰訊混元大模型已實(shí)現(xiàn)圖像、視頻、3D、文本等在內(nèi)的全模態(tài)開源,圖像、視頻衍生模型數(shù)量達(dá)到3000+個(gè),混元3D系列模型社區(qū)下載量超過230萬(wàn),成為“最受歡迎的3D開源模型”。而面向端側(cè)的0.5B到7B系列小模型也在近期陸續(xù)開源,助力開發(fā)者高效構(gòu)建AI原生應(yīng)用。
混元系列小模型陸續(xù)開源。
自2025年以來(lái),騰訊混元大模型持續(xù)迭代、小步快跑,混元家族不斷拓展,端到端語(yǔ)音模型Voice、多模態(tài)理解模型Vision等相繼推出。尤其在多模態(tài)理解上,騰訊今年連續(xù)發(fā)布多款模型,在LMArenaVision全球大模型權(quán)威榜單中躍居國(guó)內(nèi)榜首,中文能力穩(wěn)居全球第一梯隊(duì)。
而對(duì)于AI發(fā)展態(tài)勢(shì),騰訊相關(guān)負(fù)責(zé)人表示,AI是一場(chǎng)工業(yè)革命級(jí)的技術(shù)創(chuàng)新,對(duì)個(gè)人和產(chǎn)業(yè)發(fā)展都將產(chǎn)生前所未有的價(jià)值。但相對(duì)于一個(gè)完整的技術(shù)周期,當(dāng)前AI還處于發(fā)展的初級(jí)階段。
因此,騰訊的技術(shù)戰(zhàn)略,仍然是夯實(shí)地基、咬定“平臺(tái)能力”不放松。現(xiàn)成的例子是,WAIC大會(huì)上,面向當(dāng)前火熱的智能體(Agent)應(yīng)用開發(fā),騰訊云推出了全新升級(jí)的智能體開發(fā)平臺(tái),幫助企業(yè)一站式完成從數(shù)據(jù)處理、模型訓(xùn)練、知識(shí)融合到部署上線的完整流程,降低智能體開發(fā)門檻。
“騰訊將持續(xù)圍繞模型、平臺(tái)、應(yīng)用等維度發(fā)力,結(jié)合騰訊豐富的應(yīng)用生態(tài)優(yōu)勢(shì),全方位推動(dòng)AI從技術(shù)突破走向場(chǎng)景實(shí)踐,讓好用的AI出現(xiàn)在離用戶和產(chǎn)業(yè)更近的地方。”陳鵬說(shuō)。
本文鏈接:“大廠”角逐大模型,它為何成為“新基建”http://www.sq15.cn/show-11-24650-0.html
聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。