21世紀(jì)經(jīng)濟(jì)報(bào)道記者白楊 北京報(bào)道
“我個(gè)人感覺(jué)兩次參會(huì)的變化還是挺大的,需要準(zhǔn)備的工作也很多。”近日,全國(guó)政協(xié)委員、知乎創(chuàng)始人兼CEO周源在接受21世紀(jì)經(jīng)濟(jì)報(bào)道記者采訪時(shí)說(shuō)道。
2023年,周源首次以全國(guó)政協(xié)委員身份參加全國(guó)兩會(huì)。他表示,“去年我是站在知乎平臺(tái)的視角,看到了知識(shí)數(shù)據(jù)流動(dòng)的問(wèn)題,所以提交了一份關(guān)于打破流動(dòng)壁壘的提案”。
在過(guò)去一年,周源做了很多思考,也發(fā)現(xiàn)一些問(wèn)題沒(méi)有那么簡(jiǎn)單。“很多問(wèn)題是有相關(guān)性的,比如提到數(shù)據(jù)紅利時(shí),會(huì)涉及知識(shí)產(chǎn)權(quán)保護(hù)的問(wèn)題,也會(huì)涉及新技術(shù)所帶來(lái)的行業(yè)改變問(wèn)題。把這些問(wèn)題放在一起思考,會(huì)發(fā)現(xiàn)行業(yè)和行業(yè)之間都有一定的相關(guān)性,所以今年我準(zhǔn)備了多份提案,這個(gè)過(guò)程也是一個(gè)不斷深入思考的過(guò)程。”
據(jù)21世紀(jì)經(jīng)濟(jì)報(bào)道記者了解,周源今年提交的提案內(nèi)容,分別涉及新質(zhì)生產(chǎn)力、民營(yíng)經(jīng)濟(jì)、大模型、科普、知識(shí)產(chǎn)權(quán)保護(hù)等方向。
(全國(guó)政協(xié)委員、知乎創(chuàng)始人兼CEO周源)
發(fā)展新質(zhì)生產(chǎn)力的關(guān)鍵在人才支撐
2023年12月,中央經(jīng)濟(jì)工作會(huì)議明確提出,要以科技創(chuàng)新引領(lǐng)現(xiàn)代化產(chǎn)業(yè)體系建設(shè),強(qiáng)調(diào)“以科技創(chuàng)新推動(dòng)產(chǎn)業(yè)創(chuàng)新,特別是以顛覆性技術(shù)和前沿技術(shù)催生新產(chǎn)業(yè)、新模式、新動(dòng)能,發(fā)展新質(zhì)生產(chǎn)力”。
在周源看來(lái),“新質(zhì)生產(chǎn)力代表了生產(chǎn)力發(fā)展的新趨勢(shì)和新變化,它指向提升經(jīng)濟(jì)發(fā)展的質(zhì)量和效率。高質(zhì)量發(fā)展的必要條件就是新質(zhì)生產(chǎn)力,它是非常重要的內(nèi)在要求和著力點(diǎn)。”
而在發(fā)展新質(zhì)生產(chǎn)力的過(guò)程中,民營(yíng)企業(yè)扮演了重要角色。周源認(rèn)為,新質(zhì)生產(chǎn)力有三個(gè)“新”。首先是新業(yè)態(tài),“民營(yíng)企業(yè)可以扮演新業(yè)態(tài)試驗(yàn)田的角色,很多民營(yíng)企業(yè)比較靈活,愿意去抓一些看起來(lái)比較小的、新的現(xiàn)象和需求,并以小步快跑的形式進(jìn)行嘗試。”
其次,民營(yíng)企業(yè)是新模式的創(chuàng)新者。“當(dāng)有了新業(yè)態(tài)后,企業(yè)就要想怎么去構(gòu)建商業(yè)模式。有些模式是可借鑒的,有些則是以前沒(méi)有需要重新去思考和設(shè)計(jì)的。這個(gè)過(guò)程很殘酷,可能會(huì)有企業(yè)的生生死死,但從整個(gè)行業(yè)發(fā)展角度,企業(yè)推動(dòng)了新模式的創(chuàng)新。”周源說(shuō)道。
最后,民營(yíng)企業(yè)是新產(chǎn)業(yè)的主力軍。周源表示,“一個(gè)產(chǎn)業(yè)最后之所以能成為產(chǎn)業(yè),一定不單單因?yàn)橛幸粋€(gè)超大型的公司,而是分層次產(chǎn)生了很多‘小巨人’企業(yè)。從規(guī)模和數(shù)量的角度,在新的產(chǎn)業(yè)里,民營(yíng)企業(yè)都扮演著主力軍角色。”
至于如何發(fā)展新質(zhì)生產(chǎn)力,周源提出,新質(zhì)生產(chǎn)力的源頭在科技創(chuàng)新,落腳點(diǎn)在產(chǎn)業(yè)升級(jí),關(guān)鍵因素在人才支撐。所以加快形成新質(zhì)生產(chǎn)力,不僅需要“高精尖缺”科技人才,還要有一大批高素質(zhì)技術(shù)技能人才、大國(guó)工匠、能工巧匠等。
因此在提案當(dāng)中,周源也建議“健全‘新職人’群體終身職業(yè)技能提升機(jī)制”。所謂“新職人”群體,是指接受過(guò)高等教育,具有科學(xué)文化素養(yǎng)和專業(yè)經(jīng)驗(yàn)技能,從事先進(jìn)制造業(yè)和第三產(chǎn)業(yè),居住在城鎮(zhèn)的從業(yè)人員,預(yù)計(jì)規(guī)模達(dá)到4億人。
周源表示,“新職人”群體面對(duì)激烈的市場(chǎng)競(jìng)爭(zhēng)壓力,擁有不斷學(xué)習(xí)、不斷更新專業(yè)經(jīng)驗(yàn)技能的強(qiáng)大動(dòng)力,對(duì)實(shí)現(xiàn)人生價(jià)值有更高的期待。為“新職人”提供更有針對(duì)性的職業(yè)技能提升服務(wù),是幫助中國(guó)從人口紅利轉(zhuǎn)向人才紅利轉(zhuǎn)型,拉動(dòng)未來(lái)產(chǎn)業(yè)發(fā)展和形成新質(zhì)生產(chǎn)的重要引擎。
中文語(yǔ)料資源短缺問(wèn)題亟待解決
在接受記者采訪過(guò)程中,周源多次提到,隨著人工智能技術(shù)的快速發(fā)展,尤其是以GPT為代表的大模型技術(shù)的崛起,人工智能已經(jīng)成為經(jīng)濟(jì)社會(huì)發(fā)展的關(guān)鍵驅(qū)動(dòng)力。
過(guò)去一年,中國(guó)在大模型方向也緊跟國(guó)際前沿步伐。截至2023年年底,中國(guó)累計(jì)發(fā)布了200多個(gè)人工智能大模型,其中有20多個(gè)大模型產(chǎn)品獲批向公眾提供服務(wù)。
但在周源看來(lái),盡管中國(guó)在大模型領(lǐng)域取得了一定成就,但仍面臨著一些挑戰(zhàn),其中最顯著的問(wèn)題之一是高質(zhì)量中文語(yǔ)料資源的短缺。
IDC Global DataSphere 2022數(shù)據(jù)顯示,2021-2026年中國(guó)數(shù)據(jù)量規(guī)模將由18.51ZB增長(zhǎng)至56.16ZB,年均復(fù)合增長(zhǎng)率達(dá)到24.9%,高于全球平均水平。然而,盡管國(guó)內(nèi)存量數(shù)據(jù)資源豐富,但由于數(shù)據(jù)挖掘不足、無(wú)法自由在市場(chǎng)上流通等現(xiàn)狀,目前中文優(yōu)質(zhì)數(shù)據(jù)仍然稀缺,如ChatGPT訓(xùn)練數(shù)據(jù)中中文資料比重不足千分之一,而英文資料占比超過(guò)92.6%。
這也導(dǎo)致國(guó)內(nèi)許多從事大模型開發(fā)的研究機(jī)構(gòu)和企業(yè)在進(jìn)行模型訓(xùn)練時(shí),不得不依賴于外文標(biāo)注數(shù)據(jù)集、開源數(shù)據(jù)集,或是爬取網(wǎng)絡(luò)數(shù)據(jù)。
周源向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,解決中文語(yǔ)料資源短缺的問(wèn)題,實(shí)際上應(yīng)該是先構(gòu)建“水庫(kù)”,然后再去合理使用的過(guò)程。但是現(xiàn)在,行業(yè)對(duì)構(gòu)建“水庫(kù)”的工作重視不夠,反而都比較看重怎么去“打水”,所以未來(lái)幾年,中文語(yǔ)料資源短缺都將是一個(gè)特別嚴(yán)重的問(wèn)題。
因此在提案中,周源也建議“加快高質(zhì)量中文數(shù)據(jù)集的開發(fā)與利用”。周源認(rèn)為,首先要規(guī)范數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)。“中文數(shù)據(jù)要素存在數(shù)據(jù)不完整、標(biāo)注不一致、數(shù)據(jù)重復(fù)、數(shù)據(jù)更新等問(wèn)題,建設(shè)標(biāo)準(zhǔn)化、規(guī)范化的數(shù)據(jù)標(biāo)注方法,有助于加快數(shù)據(jù)要素的共享、流通與交易。”
其次是要加快探索數(shù)據(jù)要素交易模式。因缺乏合理的定價(jià)機(jī)制、明確的供需關(guān)系、成熟的商業(yè)模式,國(guó)產(chǎn)數(shù)據(jù)集市場(chǎng)影響力及普及度還存在較大差距。而由政府引導(dǎo)或相關(guān)行業(yè)組織牽頭構(gòu)建有利于數(shù)據(jù)交易模式創(chuàng)新與合規(guī)的新秩序,有助于推動(dòng)數(shù)據(jù)交易行業(yè)有序發(fā)展和健康成長(zhǎng)。
最后,周源建議要加大政府主導(dǎo)的公共數(shù)據(jù)資源開放共享。其指出,“當(dāng)前,我國(guó)已開始全面部署和推行公共數(shù)據(jù)開放制度,但公共數(shù)據(jù)開放仍然存在數(shù)據(jù)開放利用不充分、不協(xié)同、不平衡、不可持續(xù)等問(wèn)題,加快構(gòu)建標(biāo)準(zhǔn)統(tǒng)一、布局合理、管理協(xié)同、安全可靠的公共大數(shù)據(jù)資源體系,有助于大模型訓(xùn)練數(shù)據(jù)質(zhì)量提升。”
本文鏈接:聚焦兩會(huì)丨對(duì)話全國(guó)政協(xié)委員、知乎創(chuàng)始人兼CEO周源:中國(guó)大模型面臨中文語(yǔ)料資源短缺的挑戰(zhàn)http://www.sq15.cn/show-2-3408-0.html
聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇: 聚焦兩會(huì)丨專訪全國(guó)政協(xié)委員、天娛數(shù)科副總經(jīng)理賀晗:加快拓展AI大模型技術(shù)應(yīng)用場(chǎng)景