21世紀(jì)經(jīng)濟(jì)報(bào)道記者孔海麗、實(shí)習(xí)生張奕丹 北京報(bào)道
“要去和擎天柱散散步了”。北京時(shí)間1月31日,馬斯克在社交平臺(tái)X曬出了特斯拉旗下人形機(jī)器人Optimus(擎天柱)行走的視頻,再次掀起智能機(jī)器人的話題熱度。就在日前,馬斯克還曾在特斯拉的財(cái)報(bào)會(huì)上透露,人形機(jī)器人最終可能成為特斯拉的最大業(yè)務(wù),擎天柱或?qū)⒃诿髂陮?shí)現(xiàn)交付。
馬斯克曬出的Optimus(擎天柱)行走狀態(tài)。圖源:X
人工智能浪潮席卷,其中,大模型作為應(yīng)用層最具代表性的明星產(chǎn)品,過(guò)去一年可謂狂飆突進(jìn)。但其實(shí),AI+機(jī)器人、AIPC、AI手機(jī)也是重要的應(yīng)用方向,且有望帶來(lái)產(chǎn)業(yè)的革命性時(shí)刻,甚至走入新一個(gè)春天。
過(guò)去數(shù)年,人形機(jī)器人的發(fā)展一直受限于技術(shù)與應(yīng)用的雙重局限,但隨著AI技術(shù)越過(guò)山丘,AI加持下的智能機(jī)器人產(chǎn)業(yè),奇點(diǎn)已至。
用一個(gè)比喻來(lái)形容,對(duì)于能夠執(zhí)行精細(xì)且復(fù)雜物理操作的智能機(jī)器人來(lái)說(shuō),AI相當(dāng)于大腦,機(jī)器人運(yùn)動(dòng)控制器相當(dāng)于小腦,機(jī)器人就是軀干,三者組合,才意味著完整的機(jī)器人系統(tǒng)。
多家研究機(jī)構(gòu)指出,人形機(jī)器人正是AI的具身化載體,也是實(shí)現(xiàn)通用人工智能最有效的載體。高盛在分析中表示,最理想情況下,預(yù)計(jì)2035年人形機(jī)器人市場(chǎng)空間有望達(dá)1540億美元。
千億美元產(chǎn)業(yè)藍(lán)海就在眼前,科技巨頭們爭(zhēng)先恐后入局。
除了特斯拉這條“鯰魚(yú)”,其他參與方也在AI機(jī)器人的研發(fā)方面熱情滿滿,如谷歌與斯坦福推出了AI機(jī)器人Mobile ALOHA, OpenAI積極支持機(jī)器人企業(yè)1X的融資。大模型迭代升級(jí),人形機(jī)器人應(yīng)用場(chǎng)景不斷拓展,讓實(shí)際落地不再遙遙無(wú)期。國(guó)內(nèi)人形機(jī)器人頭部玩家優(yōu)必選也已于2023年底在港交所上市,成為我國(guó)“人形機(jī)器人第一股”。
但與此同時(shí),AI機(jī)器人行業(yè)的發(fā)展仍面臨著制造成本高昂、訓(xùn)練泛化難度高、場(chǎng)景應(yīng)用受限等問(wèn)題,這給AI機(jī)器人投入量產(chǎn)和大規(guī)模應(yīng)用帶來(lái)了考驗(yàn)。
AI 機(jī)器人各顯“賢惠”
近段時(shí)間,AI機(jī)器人領(lǐng)域頗為熱鬧,疊衣服、炒菜、煮咖啡,大有承包家務(wù)的勢(shì)頭。
馬斯克在X上曬出的Optimus(擎天柱)自主行走視頻顯示,該款智能機(jī)器人已經(jīng)可以模仿人類的自如行走,步態(tài)輕盈自然。視頻中,擎天柱去掉了外殼,內(nèi)部電機(jī)、電線等構(gòu)成清晰可見(jiàn),但行走動(dòng)作并不呆滯,擬人化特征相當(dāng)高。
就在不久前,馬斯克還公布過(guò)擎天柱疊衣服的視頻,其可以順暢地將一件襯衫從洗衣籃中拿出,并在臺(tái)面上折疊好,手臂與手指應(yīng)用靈活。谷歌DeepMind與斯坦福團(tuán)隊(duì)共同推出的Mobile ALOHA,展示了煮蝦、擦桌子、洗盤(pán)子等功能;來(lái)自中國(guó)的機(jī)器人創(chuàng)企MagicLab則展示了人形機(jī)器人煮咖啡的過(guò)程。
而在剛剛結(jié)束的2024年美國(guó)消費(fèi)電子展(CES2024)上,國(guó)產(chǎn)開(kāi)普勒人形機(jī)器人亮相,可以實(shí)現(xiàn)多場(chǎng)景應(yīng)用,包括教育科研、自動(dòng)化生產(chǎn)線、智能搬運(yùn)、復(fù)雜環(huán)境巡檢、應(yīng)急救援、戶外安全作業(yè)、危險(xiǎn)環(huán)境檢測(cè)、安全隱患排查等。
CES2024上,三星公布了新版本的Ballie機(jī)器人管家,能夠與智能家居聯(lián)動(dòng);LG展示了雙足家庭機(jī)器人助理Moving Smart Home Hub;亞馬遜投資的創(chuàng)企Embodied也在CES上展示了教育機(jī)器人Moxie AI,可以與兒童進(jìn)行眼神交流及語(yǔ)音對(duì)話。
CES展會(huì)上部分機(jī)器人 圖源:各官網(wǎng)
在研發(fā)速度上,新興科技企業(yè)也在不斷突破。
成立于2022年的Figure,于1月7日發(fā)布了一段人形機(jī)器人Figure 01“煮咖啡”的視頻,號(hào)稱僅10小時(shí)內(nèi)便教會(huì)人形機(jī)器人此項(xiàng)技能。前谷歌DeepMind研究員、同時(shí)也是該機(jī)器人的開(kāi)發(fā)人員Corey Lynch稱這是通過(guò)端到端人工智能訓(xùn)練實(shí)現(xiàn)的,所有行為(包括矯正)都是自主的,并沒(méi)有使用遠(yuǎn)程操控。而在2023年10月,F(xiàn)igure 01才被正式推出,到如今實(shí)現(xiàn)“10小時(shí)教會(huì)機(jī)器人煮咖啡”的突破只用了3個(gè)月的時(shí)間。
此前,根據(jù)特斯拉在2022 AI Day中披露的細(xì)節(jié),特斯拉人形機(jī)器人Optimus的制造耗時(shí)6個(gè)月,實(shí)現(xiàn)行走和手臂搖擺動(dòng)作分別用了8個(gè)月和12個(gè)月。相較而言,F(xiàn)igure的研發(fā)速度還要更勝一籌。
Figure01正在煮咖啡 圖源:X
不過(guò),并非所有AI機(jī)器人的家務(wù)活都是自主行為,谷歌與斯坦福的Mobile ALOHA所展示的煮蝦、坐電梯、擦桌子、與人擊掌、洗盤(pán)子、整理桌椅等任務(wù),其中部分行為由人類遠(yuǎn)程操控完成。
擎天柱疊衣服被網(wǎng)友質(zhì)疑與斯坦福機(jī)器人“炒菜”類似,是通過(guò)遙操作系統(tǒng)實(shí)現(xiàn)的。對(duì)此,馬斯克并沒(méi)有正面回答,只是承認(rèn)機(jī)器人自主疊衣服尚且需要時(shí)間。
AI機(jī)器人元年
2023年,OpenAI發(fā)布了大模型ChatGPT,這是一種生成式人工智能,有較強(qiáng)理解與生成對(duì)話能力。ChatGPT的誕生,奏響了大模型爆火的樂(lè)章,也間接摁下了AI機(jī)器人快速演進(jìn)的按鈕。
早在1986年,日本本田公司就公布了全球首個(gè)商業(yè)用途人形機(jī)器人ASIMO,具備完整的身體運(yùn)動(dòng)能力,之后也有企業(yè)相繼開(kāi)始了人形機(jī)器人的研發(fā)業(yè)務(wù)并取得了一定成效,但由于過(guò)去大規(guī)模剛需應(yīng)用場(chǎng)景不足、技術(shù)復(fù)雜以及成本過(guò)高等問(wèn)題,機(jī)器人難以成熟落地。
從整個(gè)機(jī)器人發(fā)展歷程來(lái)看,智能機(jī)器人已經(jīng)迭代到了第三代。與歷代機(jī)器人相比,人形AI機(jī)器人有更高的感知、運(yùn)動(dòng)控制和交互能力,可以應(yīng)用于多個(gè)場(chǎng)景。例如在工廠中進(jìn)行倉(cāng)儲(chǔ)物流管理、上下樓梯移動(dòng)貨物等,在家庭里陪伴教育、充當(dāng)醫(yī)療助理協(xié)助老人生活、照顧孩子、做飯等;能夠替代人類進(jìn)行高危工作,如救火、有毒物質(zhì)清理等。
如今有了AI加成, 又出現(xiàn)了End-to-end端到端模型,讓以往復(fù)雜的場(chǎng)景理解和建模過(guò)程可以被簡(jiǎn)化,機(jī)器人通過(guò)海量的訓(xùn)練數(shù)據(jù)可以直接訓(xùn)練,智能程度不斷提升,技術(shù)上的難點(diǎn)得以突破。
業(yè)內(nèi)人士舉例說(shuō)明,以前,機(jī)器人的人機(jī)交互方式從編寫(xiě)代碼到示教拖拽式,總歸存在一定的使用門(mén)檻,但通過(guò)大模型結(jié)合機(jī)器人的操控,使得以后可以借助自然語(yǔ)言驅(qū)動(dòng)機(jī)器人,這個(gè)過(guò)程無(wú)論是對(duì)普通人控制機(jī)器人,或是企業(yè)研發(fā),都極為有幫助。
中信證券方面認(rèn)為,隨著AI迅速發(fā)展,人形機(jī)器人奇點(diǎn)已至,機(jī)器人在AI的加成下逐步由“功能”走向“智能”。
2023年不僅是大模型元年,也是人形機(jī)器人相關(guān)產(chǎn)業(yè)的元年,機(jī)器人、家電、車(chē)企等各界玩家進(jìn)入賽道,有了實(shí)質(zhì)性的成效。
聚焦到國(guó)內(nèi),在政策上,2023年11月,工信部發(fā)布《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見(jiàn)》,北上深等各地方政府陸續(xù)發(fā)布機(jī)器人相關(guān)支持性政策,為AI機(jī)器人行業(yè)的發(fā)展保駕護(hù)航。同時(shí),以拓普集團(tuán)、三花智控為代表的上游零部件企業(yè)也在加速研發(fā)布局。
2023年3月,追覓科技掃地機(jī)器人、送餐機(jī)器人、四足機(jī)器狗、人形機(jī)器人等亮相機(jī)器人大會(huì);康復(fù)機(jī)器人企業(yè)傅利葉于2023年7月發(fā)布通用人形機(jī)器人GR-1,并開(kāi)啟預(yù)售和量產(chǎn)交付;2023年8月,宇樹(shù)科技發(fā)布首款通用人形機(jī)器人Unitree H1,這是國(guó)內(nèi)第一臺(tái)能跑的全尺寸通用人形機(jī)器人;2023年8月,智元機(jī)器人發(fā)布智能機(jī)器人遠(yuǎn)征A1,展示了擰螺絲、底盤(pán)裝配、家庭陪伴、危化品實(shí)驗(yàn)等多場(chǎng)景應(yīng)用。
2023年10月,小鵬汽車(chē)展示了自研的人形機(jī)器人PX5,雙手仿人靈巧,可以進(jìn)行類人的雙足行走。未來(lái)可以實(shí)現(xiàn)工廠生產(chǎn)、巡邏,甚至是幫忙賣(mài)車(chē)。小鵬汽車(chē)董事長(zhǎng)何小鵬曾公開(kāi)表示,汽車(chē)公司的未來(lái),將是AI汽車(chē)和機(jī)器人的結(jié)合。
表1:各公司人形機(jī)器人要素對(duì)比
在AI機(jī)器人商業(yè)化層面,2023年12月,九號(hào)公司紀(jì)亞飛稱其研發(fā)生產(chǎn)的AIBOX已經(jīng)裝入美團(tuán)街頭跑的無(wú)人車(chē),能夠?qū)β访媲闆r迅速甄別并做出反應(yīng);Figure于今年1月18日宣布與汽車(chē)巨頭寶馬達(dá)成協(xié)議,正式將人形機(jī)器人引入寶馬的汽車(chē)制造工廠。機(jī)器人將在接受特定任務(wù)培訓(xùn)后,在未來(lái)12-24個(gè)月內(nèi)逐漸整合到車(chē)身車(chē)間、倉(cāng)庫(kù)等制造流程中;智元機(jī)器人稚暉君表示遠(yuǎn)征 A1 將首先用于新能源制造等場(chǎng)景,目前正在與頭部企業(yè)進(jìn)行對(duì)接;傅利葉GR-1、開(kāi)普勒人形機(jī)器人的量產(chǎn)交付計(jì)劃也已經(jīng)提上日程。
機(jī)遇與挑戰(zhàn)并存
不可否認(rèn),AI機(jī)器人領(lǐng)域的潛力巨大,但目前仍然存在不少難點(diǎn)和挑戰(zhàn)。
首先是成本造價(jià)依然高昂。中信證券分析師根據(jù)海外Digit等人形機(jī)器人的售價(jià)25萬(wàn)美元預(yù)計(jì)毛利率約為25%,推測(cè)當(dāng)前人形機(jī)器人的造價(jià)在十幾萬(wàn)美元左右。有專業(yè)人士分析,硬件上的零部件成本占大頭,僅高性能控制器的價(jià)格就高達(dá)上萬(wàn)元。
而根據(jù)特斯拉2022 AI Day2披露的信息,未來(lái)特斯拉人形機(jī)器人的售價(jià)將會(huì)降到2萬(wàn)美元(折合人民幣14萬(wàn)元左右);開(kāi)普勒計(jì)劃將人形機(jī)器人計(jì)劃將價(jià)格控制約為2-3萬(wàn)美元(折合人民幣14-21萬(wàn)元)左右。在智元機(jī)器人發(fā)布會(huì)上,智元機(jī)器人預(yù)估未來(lái)其首款人形機(jī)器人遠(yuǎn)征A1的制造成本將會(huì)被控制在20萬(wàn)元以內(nèi)。如果真的能將成本造價(jià)“打下來(lái)”,或許能突破人形機(jī)器人大規(guī)模應(yīng)用的瓶頸。
其次是機(jī)器人在各場(chǎng)景的實(shí)際應(yīng)用。
人能夠掌握“默會(huì)知識(shí)”,在實(shí)際生活中并不只依賴于經(jīng)驗(yàn)總結(jié),而是能夠形成自己解決問(wèn)題的邏輯,但是這對(duì)于傳統(tǒng)的編程機(jī)器人不太可能完成,因?yàn)榄h(huán)境變量太多、過(guò)于復(fù)雜,機(jī)器人難以應(yīng)對(duì)。
隨著大模型出現(xiàn)和發(fā)展,能提高機(jī)器人對(duì)人類指令的理解能力,解決此問(wèn)題的方式由針對(duì)單一任務(wù)建立一個(gè)通用預(yù)測(cè)模型進(jìn)行“舉一反三”,到現(xiàn)在變成借助多模態(tài)神經(jīng)網(wǎng)絡(luò)融合實(shí)現(xiàn),能夠集視覺(jué)、觸覺(jué)、運(yùn)動(dòng)、關(guān)節(jié)控制等為一體,解決更加復(fù)雜和多元化的問(wèn)題。
最近,瑞士蘇黎世聯(lián)邦理工學(xué)院在一項(xiàng)研究中借助圖神經(jīng)網(wǎng)絡(luò)(GNN)的模型,通過(guò)收集大量合成圖像和在真實(shí)環(huán)境中捕獲的布料圖像進(jìn)行預(yù)訓(xùn)練,已經(jīng)讓機(jī)器人能夠有效判斷整個(gè)布料的形狀、位置和可見(jiàn)度。這與特斯拉人形訓(xùn)練機(jī)器人疊衣服的行為不謀而合,機(jī)器人“保姆”或許在不久的將來(lái)就會(huì)誕生。
錢(qián)江機(jī)器人孔民秀對(duì)ChatGPT大模型在工業(yè)機(jī)器人上的使用提出了不同意見(jiàn),認(rèn)為大數(shù)據(jù)模型的可靠性存在提升空間,且在智能焊接,智能搬運(yùn)等方面,大模型的成本過(guò)高。也就是說(shuō),如何將AI大模型技術(shù)與機(jī)器人更好地融合,是一個(gè)難點(diǎn)。
除此之外,人形機(jī)器人的算法系統(tǒng)和算力也是研發(fā)過(guò)程中需要重點(diǎn)關(guān)注的板塊。前者與機(jī)器人行走、行為協(xié)同操作息息相關(guān),后者決定了機(jī)器人的續(xù)航和散熱。解決這些問(wèn)題,AI機(jī)器人的道路才能越走越寬。
本文鏈接:AI機(jī)器人“卷出花” 產(chǎn)業(yè)進(jìn)入奇點(diǎn)時(shí)刻丨AI應(yīng)用之道①http://www.sq15.cn/show-2-2573-0.html
聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。