中新經(jīng)緯5月9日電 (閆淑鑫 羅琨 實(shí)習(xí)生 賀賽)“追求智能的上限仍是當(dāng)下大模型最重要的一件事。”8日,階躍星辰創(chuàng)始人、CEO姜大昕接受中新經(jīng)緯等媒體采訪時(shí)說。
階躍星辰成立于2023年,是⾏業(yè)領(lǐng)先的通⽤⼤模型創(chuàng)業(yè)公司,目前已對(duì)外發(fā)布Step系列基座⼤模型矩陣。在此次采訪中,姜大昕透露了階躍星辰的大模型應(yīng)用進(jìn)展以及其對(duì)行業(yè)的最新研判。
姜大昕 受訪者供圖
把推理引入多模態(tài)領(lǐng)域
姜大昕表示,目前大模型領(lǐng)域呈現(xiàn)兩大趨勢(shì),一是從模仿學(xué)習(xí)到強(qiáng)化學(xué)習(xí),二是從多模態(tài)融合走向多模態(tài)理解生成一體化。所謂強(qiáng)化學(xué)習(xí),即培養(yǎng)機(jī)器解決復(fù)雜問題的能力,讓機(jī)器學(xué)會(huì)慢思考,產(chǎn)生長(zhǎng)思維鏈,極大地提高大模型的推理能力。
“強(qiáng)化學(xué)習(xí)趨勢(shì)還會(huì)延續(xù)相當(dāng)長(zhǎng)一段時(shí)間,因?yàn)檫€有很多有意思的問題還在討論,比如推理的效率如何進(jìn)一步提高,推理的能力是不是能泛化到更多沒有獎(jiǎng)勵(lì)函數(shù)、或者說獎(jiǎng)勵(lì)函數(shù)也很難定義的領(lǐng)域,合成數(shù)據(jù)怎么去生成,怎么進(jìn)行預(yù)訓(xùn)練等等,這些都是眼下學(xué)術(shù)界、工業(yè)界大家討論非常多的熱點(diǎn)問題,階躍星辰也會(huì)在這方面持續(xù)投入。”姜大昕稱。
除了行業(yè)大熱的語言模型推理外,姜大昕認(rèn)為大模型還需要掌握的一項(xiàng)能力是如何把推理引入到多模態(tài)領(lǐng)域。“確切地說就是能不能在視覺理解的基礎(chǔ)上加上視覺推理。這種能力相比原先的視覺理解強(qiáng)化了很多,在實(shí)際的應(yīng)用中我們經(jīng)常會(huì)需要這樣復(fù)雜的推理。”
姜大昕以階躍星辰智能巡檢應(yīng)用為例介紹,奶茶店在使用這款大模型應(yīng)用后,只需將規(guī)則寫入prompt(AI模型提示詞),該應(yīng)用就能自動(dòng)進(jìn)行推送,幫助品牌和門店檢測(cè)員工的操作是否合乎規(guī)范,準(zhǔn)確率達(dá)到90%以上,極大地提高了巡店效率。
階躍星辰方面提供的資料顯示,⽬前,全國數(shù)千家茶百道⻔店已經(jīng)接⼊階躍星⾠Step-1V多模態(tài)理解⼤模型 ,平均每天上百萬杯茶飲在⼤模型智能巡檢的守護(hù)下送到消費(fèi)者⼿中。
類似的大模型還被用在了短劇審核上。“我也是跟從事短劇的業(yè)內(nèi)人士討論了以后才知道,現(xiàn)在短劇最卡脖子、最瓶頸的地方不是短劇的生產(chǎn),而是短劇的審核,因?yàn)樾枰斯徍耍孕史浅5汀S昧宋覀兊拇竽P秃螅瑢徍诵蕪脑瓉淼?0天變成了一個(gè)星期。”姜大昕稱。
從模型到智能體
隨著大模型能力不斷增強(qiáng),相關(guān)應(yīng)用也在發(fā)生變化。
“說起應(yīng)用,當(dāng)下最熱的概念就是Agent(智能體),很多人說2025年是Agent元年。在早期,比較流行的大模型應(yīng)用是各種各樣的聊天機(jī)器人;有了Agent以后,我們可以用它來解數(shù)學(xué)題、寫代碼等。”姜大昕表示。
在他看來,智能體之所以能在2025年爆發(fā),主要是因?yàn)榇竽P鸵呀?jīng)具備了兩大必要條件:一是多模態(tài)能力,二是慢思考能力。“這兩項(xiàng)能力在2024年取得了突破性進(jìn)展。”
姜大昕介紹,多模態(tài)可以讓智能體充分理解、感知世界,從而更好地理解用戶的意圖。多模態(tài)不僅能和用戶進(jìn)行自然地交流,還能感知到用戶所處的環(huán)境,理解用戶任務(wù)的上下文。而如果想讓任務(wù)的完成率更高,Agent還需具備強(qiáng)大的推理能力,即慢思考的能力。
2025年2⽉,階躍星⾠在開放⽇上宣布將智能終端Agent視為⼤模型技術(shù)落地的核⼼突破點(diǎn) ,并重點(diǎn)布局汽車、⼿機(jī)、具⾝智能、IoT等關(guān)鍵應(yīng)⽤場(chǎng)景。
“在當(dāng)前的競(jìng)爭(zhēng)格局中,階躍差異化的特點(diǎn)就是多模態(tài)的能力,眼下很多模態(tài)在業(yè)界的性能是領(lǐng)先的;在應(yīng)用層面,我們也走了一條差異化路線,攜手合作伙伴在智能終端Agent這個(gè)方向上發(fā)力,最終形成一個(gè)從模型到Agent,從云側(cè)到端側(cè)的生態(tài)體系。我們認(rèn)為軟硬結(jié)合能更好地理解用戶的需求,完成用戶的任務(wù)。”姜大昕表示。
大模型投流邏輯不成立
業(yè)內(nèi)有人認(rèn)為,人工智能的C端產(chǎn)品在商業(yè)化過程中采用了互聯(lián)網(wǎng)的套路,比如部分企業(yè)瘋狂投流等。
“我覺得DeepSeek出來后,給了我們一個(gè)經(jīng)驗(yàn),即投流的邏輯是不成立的。DeepSeek從來沒有投流,它如果放開流量,破億是沒有問題的。AI時(shí)代,產(chǎn)品的流量增長(zhǎng)是靠傳統(tǒng)的互聯(lián)網(wǎng),還是靠投流上去的,DeepSeek給了大家一個(gè)重新看待這個(gè)問題的窗口。不光是DeepSeek,像《哪吒2》《黑神話悟空》,它們都有一些共性,不是靠鋪天蓋地的投流積累用戶的。”姜大昕表示。
在采訪中,姜大昕感慨,人工智能的發(fā)展和變化太快了。“去年大家還覺得GPT-4很牛,Sora剛出來時(shí)也給大家?guī)砹藰O大的震撼,但現(xiàn)在去看,技術(shù)已經(jīng)在此基礎(chǔ)上進(jìn)行了迭代。也許明年再回頭看今年的技術(shù),又會(huì)覺得現(xiàn)在這些都微不足道。”
姜大昕稱,在技術(shù)快速發(fā)展的過程中,階躍星⾠不會(huì)放棄主流增長(zhǎng)趨勢(shì)、前進(jìn)趨勢(shì),仍將堅(jiān)持做基礎(chǔ)模型的研發(fā)。
“在應(yīng)用的角度來,我們一直覺得應(yīng)用和模型是相輔相成的。模型可以決定應(yīng)用的上限,應(yīng)用給模型提供具體的應(yīng)用場(chǎng)景和數(shù)據(jù)。雖然我們的產(chǎn)品形態(tài)會(huì)隨著模型的演變動(dòng)態(tài)發(fā)展,但背后的邏輯關(guān)系會(huì)一直保持下去。”姜大昕稱。
(更多報(bào)道線索,請(qǐng)聯(lián)系本文作者閆淑鑫:yanshuxin@chinanews.com.cn)(中新經(jīng)緯APP)
中新經(jīng)緯版權(quán)所有,未經(jīng)書面授權(quán),任何單位及個(gè)人不得轉(zhuǎn)載、摘編或以其他方式使用。
責(zé)任編輯:常濤 李中元
本文鏈接:【百家民企說】對(duì)話階躍星辰創(chuàng)始人:追求智能的上限,仍是當(dāng)下大模型最重要的事http://www.sq15.cn/show-2-12350-0.html
聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇: 推動(dòng)生成式人工智能賦能產(chǎn)業(yè)發(fā)展
下一篇: 香港商經(jīng)局局長(zhǎng)丘應(yīng)樺:營(yíng)造有利環(huán)境 為6G時(shí)代做好準(zhǔn)備