21世紀(jì)經(jīng)濟(jì)報(bào)道記者 鄭雪 馮戀閣 北京、廣州報(bào)道
近日,2024北京AI原生產(chǎn)業(yè)創(chuàng)新大會(huì)暨北京數(shù)據(jù)基礎(chǔ)制度先行區(qū)成果發(fā)布會(huì)上,北京人工智能數(shù)據(jù)訓(xùn)練基地正式啟用。同日,北京規(guī)模最大的公共算力平臺(tái)——北京亦莊人工智能公共算力平臺(tái)也同步正式啟用。
2024年《政府工作報(bào)告》提出,要開(kāi)展“人工智能+”行動(dòng),AI發(fā)展駛上快車(chē)道。在Scaling Law(規(guī)模法則)基本成為第一性原理的當(dāng)下,各地紛紛也從數(shù)據(jù)、算力入手,搶抓發(fā)展機(jī)遇。
訓(xùn)練數(shù)據(jù)來(lái)自企業(yè)
據(jù)悉,此次啟用的北京人工智能數(shù)據(jù)訓(xùn)練基地是國(guó)內(nèi)第一個(gè)人工智能數(shù)據(jù)訓(xùn)練基地。其職能主要是組織數(shù)據(jù)供給方、加工服務(wù)方、模型訓(xùn)練方“進(jìn)場(chǎng)”合作,推動(dòng)高質(zhì)量數(shù)據(jù)價(jià)值釋放,助力通用模型和行業(yè)垂類(lèi)模型訓(xùn)練精調(diào)。
數(shù)據(jù)是人工智能大模型發(fā)展的燃料,海量數(shù)據(jù)作用之下,AI智能涌現(xiàn)。可以說(shuō),誰(shuí)擁有足夠量的數(shù)據(jù),誰(shuí)就更有可能在AI競(jìng)爭(zhēng)中占據(jù)優(yōu)勢(shì)。
訓(xùn)練基地的數(shù)據(jù)何來(lái)?北京亦莊智能城市研究院集團(tuán)有限公司黨委副書(shū)記、總經(jīng)理顏敏在接受媒體采訪(fǎng)時(shí)曾表示,已有35家企業(yè)參與到了訓(xùn)練基地的建設(shè)中,分別負(fù)責(zé)數(shù)據(jù)供給、數(shù)據(jù)加工、數(shù)據(jù)需求、平臺(tái)運(yùn)營(yíng)等7個(gè)方面。其中,共有13家企業(yè)為訓(xùn)練基地提供了總計(jì)6.8T的數(shù)據(jù)。
作為人工智能成長(zhǎng)的“養(yǎng)料”,數(shù)據(jù)不僅要保持足夠供給,還需做好數(shù)據(jù)版權(quán)、權(quán)責(zé)分配等合規(guī)工作。
面對(duì)安全之問(wèn),北京人工智能數(shù)據(jù)訓(xùn)練基地以“監(jiān)管沙盒”機(jī)制進(jìn)行了回應(yīng)。
監(jiān)管沙盒的優(yōu)勢(shì)在于,能夠減少創(chuàng)新理念進(jìn)入市場(chǎng)的時(shí)間與潛在成本,降低監(jiān)管不確定性,防止風(fēng)險(xiǎn)大面積外溢引發(fā)危害事故。
具體來(lái)看,政策創(chuàng)新方面,監(jiān)管沙盒將遵循弱版權(quán)保護(hù)政策、通知移除規(guī)則、風(fēng)險(xiǎn)補(bǔ)償規(guī)則和創(chuàng)新糾紛解決機(jī)制,降低潛在數(shù)據(jù)風(fēng)險(xiǎn);在數(shù)據(jù)安全方面,監(jiān)管沙盒將通過(guò)完善的技術(shù)安全保障措施降低數(shù)據(jù)安全隱患,確保數(shù)據(jù)存儲(chǔ)、加工和交付的安全,并即時(shí)監(jiān)管數(shù)據(jù)使用的合規(guī)性。
算力方面,北京亦莊人工智能公共算力平臺(tái)可提供算力達(dá)3000P,算力規(guī)模在北京排名第一。
北京一直有發(fā)展成為人工智能高地的野心。北京市經(jīng)濟(jì)和信息化局?jǐn)?shù)據(jù)顯示,截至2022年10月,北京擁有人工智能核心企業(yè)1048家,占我國(guó)人工智能核心企業(yè)總量的29%。
2023年11月,全國(guó)首個(gè)數(shù)據(jù)基礎(chǔ)制度先行區(qū)——北京數(shù)據(jù)基礎(chǔ)制度先行區(qū)啟動(dòng)。根據(jù)《北京數(shù)據(jù)基礎(chǔ)制度先行區(qū)創(chuàng)建方案》,到2030年,北京匯聚高價(jià)值數(shù)據(jù)資產(chǎn)總量達(dá)到100PB,數(shù)據(jù)交易額達(dá)到100億元,數(shù)據(jù)產(chǎn)業(yè)規(guī)模超過(guò)1000億元。
2024年《北京市政府工作報(bào)告》指出,要統(tǒng)籌推進(jìn)數(shù)字產(chǎn)業(yè)化,開(kāi)展數(shù)據(jù)資產(chǎn)入表、數(shù)據(jù)跨境便利化服務(wù)等綜合改革試點(diǎn);推動(dòng)算力中心、數(shù)據(jù)訓(xùn)練基地、國(guó)家區(qū)塊鏈樞紐節(jié)點(diǎn)等一批重大項(xiàng)目落地,新建5G基站1萬(wàn)個(gè)以上。
多地?fù)屪グl(fā)展機(jī)遇
數(shù)據(jù)、算力是驅(qū)動(dòng)人工智能產(chǎn)業(yè)發(fā)展必不可少的資源,在AI加速賦能千行百業(yè)的當(dāng)下,保障數(shù)據(jù)和算力的高質(zhì)量供給成為各地的“必答題”。
在近日召開(kāi)的首次全國(guó)數(shù)據(jù)工作會(huì)議上,加快建設(shè)全國(guó)一體化算力網(wǎng)、支持公共數(shù)據(jù)開(kāi)發(fā)成為國(guó)家數(shù)據(jù)局未來(lái)一段時(shí)間工作重點(diǎn)。國(guó)家數(shù)據(jù)局發(fā)布的《深化智慧城市發(fā)展 推進(jìn)城市全域數(shù)字化轉(zhuǎn)型的指導(dǎo)意見(jiàn)(征求意見(jiàn)稿)》也提出,要統(tǒng)籌推進(jìn)城市算力網(wǎng)建設(shè),培育壯大數(shù)據(jù)產(chǎn)業(yè)等。
高質(zhì)量的數(shù)據(jù)是人工智能發(fā)展的核心要素。去年,一項(xiàng)來(lái)自Epoch AI Research團(tuán)隊(duì)的研究結(jié)果表明,高質(zhì)量的語(yǔ)言數(shù)據(jù)存量將在2026年耗盡。這意味著,如果數(shù)據(jù)效率沒(méi)有顯著提高或沒(méi)有新的數(shù)據(jù)源可用,那么到2040年,模型的規(guī)模增長(zhǎng)將放緩。
高質(zhì)量數(shù)據(jù)“見(jiàn)底”,行業(yè)數(shù)據(jù)分散等也影響訓(xùn)練數(shù)據(jù)質(zhì)量,在不遠(yuǎn)的未來(lái)應(yīng)如何解決這一問(wèn)題?
興業(yè)證券報(bào)告指出,加強(qiáng)公共數(shù)據(jù)的開(kāi)放開(kāi)發(fā),是當(dāng)前解決數(shù)據(jù)分散、提升訓(xùn)練數(shù)據(jù)質(zhì)量的重要舉措。
據(jù)21記者不完全統(tǒng)計(jì),北京、上海、深圳等地在近年來(lái)發(fā)布多份文件,力圖解決AI訓(xùn)練數(shù)據(jù)供給之困。比如,去年6月發(fā)布的《深圳市加快推動(dòng)人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動(dòng)方案(2023-2024年)》就提到,要搭建全市公共數(shù)據(jù)開(kāi)放運(yùn)營(yíng)平臺(tái),建立多模態(tài)公共數(shù)據(jù)集,打造高質(zhì)量中文語(yǔ)料數(shù)據(jù)等。
AI潮起,我國(guó)多地也加速算力產(chǎn)業(yè)布局。其中,針對(duì)人工智能的智能算力布局正逐漸鋪開(kāi)。
工信部等6部門(mén)于去年10月發(fā)布的《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》指出,要結(jié)合人工智能產(chǎn)業(yè)發(fā)展和業(yè)務(wù)需求,逐步合理提升智能算力占比。推動(dòng)不同計(jì)算架構(gòu)的智能算力與通用算力協(xié)同發(fā)展。
在數(shù)字基礎(chǔ)設(shè)施建設(shè)方面,1月,國(guó)家大數(shù)據(jù)(貴州)綜合試驗(yàn)區(qū)人工智能訓(xùn)練場(chǎng)在貴陽(yáng)大數(shù)據(jù)科創(chuàng)城舉行授牌儀式。
智算中心的建設(shè)也如火如荼。3月11日,華南數(shù)谷智算中心投產(chǎn)。該智算中心一期規(guī)劃建設(shè)了16000PAI異構(gòu)算力池,項(xiàng)目總投資達(dá)23.6億元。同樣在3月,中國(guó)移動(dòng)(克拉瑪依)云計(jì)算智算中心啟用。據(jù)介紹,到2024年底,算力集群規(guī)模將達(dá)2023P,成為西北地區(qū)規(guī)模最大的智算中心。
根據(jù)21記者不完全統(tǒng)計(jì),截至目前,包括深圳、南京、成都等多個(gè)城市都建設(shè)運(yùn)行了城市智算中心,為本地產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型、培育新興產(chǎn)業(yè)(包括大模型)等提供算力支持。
在政策方面,各地都拿出十足誠(chéng)意,以“真金白銀”促產(chǎn)業(yè)發(fā)展。去年,成都、寧夏等地則在去年宣布每年將發(fā)放總額不超過(guò)1000萬(wàn)元、4000萬(wàn)元的算力券支持機(jī)構(gòu)使用相應(yīng)資源。今年上海發(fā)布的《上海市智能算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展“算力浦江”智算行動(dòng)實(shí)施方案(2024-2025年)》提出,通過(guò)“算力券”等激勵(lì)機(jī)制,引導(dǎo)智能算力集約化調(diào)度;北京經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)管理委員會(huì)發(fā)布的《關(guān)于加快打造AI原生產(chǎn)業(yè)創(chuàng)新高地的若干政策》則表示要每年發(fā)放1億元的算力券。
本文鏈接:全國(guó)首個(gè)人工智能數(shù)據(jù)訓(xùn)練基地啟用,多地?fù)屪?shù)據(jù)、算力發(fā)展機(jī)遇http://www.sq15.cn/show-2-4578-0.html
聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。