拒絕第三方賺差價,機器人企業(yè)轉(zhuǎn)向二次開發(fā)
作者:喬心怡
人形機器人,正忙著“搭臺”。
近日,包括北京人形機器人創(chuàng)新中心、宇樹科技和智元機器人以及等多家在內(nèi)的機器人企業(yè)均對外發(fā)布了用于二次開發(fā)的工具型平臺。有的平臺主要目標客群是產(chǎn)業(yè)部署方,有的則是科研院校開發(fā)者、租賃商。從控制接口到工具鏈條,這些平臺看似方向各異,卻有一個共同指向,讓機器人更好用、更能賣。
各家公司開始意識到,真正決定競爭力的,不是機器人能做多少高難度動作,而是用更完善的工具讓客戶用起來。推出二次開發(fā)平臺,正在成為人形機器人競爭的“第二戰(zhàn)場”,它既是吸引開發(fā)者的利器,也是企業(yè)商業(yè)化“帶貨”的抓手。或許,機器人企業(yè)搭的每一個“臺”,都是在為下一輪在市場中“唱戲”鋪路。
機器人能聽懂但不會做,自定義開發(fā)成“剛需”
“我們大概有一周的時間,是住在工廠里的。”
在深圳福田的康明斯發(fā)動機工廠,北京人形機器人創(chuàng)新中心(以下簡稱“北京人形”)的人形機器人天工和天軼2.0正在無人生產(chǎn)線中完成上下料的工作。
北京人形具身智能部門負責人車正平向第一財經(jīng)記者表示,在部署過程中,團隊發(fā)現(xiàn)不同工位、不同任務(wù)對感知與控制能力的要求差異較大。
“除了能復用、標準化的開發(fā)流程以外,用戶需要能夠自定義開發(fā)和部署的工具。”
北京人形于近日開源了具身智能平臺“慧思開物”SDK,包括了大腦、小腦以及供技能調(diào)用和部署的工具鏈。記者注意到,在北京人形此次開源的大模型采用的并非只基于當前行業(yè)內(nèi)主流的端到端VLA(Vision-Language-Action,視覺語言動作模型),而是采用了分層的模型架構(gòu)。
“行業(yè)中的VLA很多,但從實際場景的運行效果上來看,并不一定是最好的。”車正平告訴第一財經(jīng)記者,由于端到端VLA一個模型直出的特性,算法的黑箱性成為了落地場景中最不可控的“雷”。“也許機器人能夠理解人類的指令,但最終的動作執(zhí)行,仍然會有偏差。”
在流水線裝配等高節(jié)拍的場景中,機器人光聽懂指令,是遠遠不夠的。
“機器人也許可以通過大腦理解‘把零件放進托盤’的指令,但由于模型缺乏對空間約束和力控反饋的建模,可能會放歪或者產(chǎn)生碰撞。”車正平說,這會導致機器人導致無法穩(wěn)定地連續(xù)作業(yè),必要時需要工程師進行自定義調(diào)整,以配合產(chǎn)線節(jié)拍和實際情況。
相比端到端直出的VLA模型,分層模型則需要先建模、再規(guī)劃、最后執(zhí)行。不過,一位端到端VLA算法工程師告訴第一財經(jīng)記者,分層帶來的結(jié)構(gòu)化優(yōu)勢,也伴隨著誤差傳導的風險。
隨著每一層模型的傳遞,模型在某一層產(chǎn)生的微小誤差,“這會在后續(xù)的環(huán)節(jié)呈現(xiàn)指數(shù)級的擴散”。
這意味著,每分出一個步驟,就有可能給模型引入噪聲。他告訴記者,如果采用分層模型的機器人在環(huán)境建模階段對工位位置的識別偏差只有1%,后續(xù)路徑規(guī)劃和控制執(zhí)行在多輪迭代中就可能將這一誤差放大幾十倍,“這可能導致機械臂在毫米級精度任務(wù)中出現(xiàn)明顯偏移,甚至影響生產(chǎn)線節(jié)拍”。
為避免多層決策中誤差被放大,車正平選擇讓視覺語言模型(VLM)與世界模型組成機器人的“大腦”。
“我們讓VLM和世界模型相互糾偏作為大腦,再與VLA等構(gòu)建的技能庫模型協(xié)作。”車正平告訴第一財經(jīng)記者,慧思開物將VLM部署在云端,用于理解人類指令、規(guī)劃任務(wù)并生成執(zhí)行策略;而世界模型負責對物理世界進行建模與預(yù)測,相當于一個“虛擬演練場”。
世界模型把“演練”結(jié)果反饋給VLM,幫助它理解策略的實際效果,在調(diào)整和學習中提升任務(wù)規(guī)劃的準確性,反過來又讓世界模型的物理預(yù)測更加精確。
二者通過反饋機制相互作用,機器人最終有機會實現(xiàn)“自我校正”。車正平認為,這種能力需要在復雜、多變的真實環(huán)境中持續(xù)進化,而要讓機器人不斷學習、適應(yīng),就需要開放的數(shù)據(jù)接口和開發(fā)生態(tài)作為支撐。正因如此,除了硬件和算法,開放的開發(fā)工具與生態(tài)接口,正成為機器人企業(yè)競爭的新關(guān)鍵。
頻推開發(fā)工具,機器人企業(yè)“搭臺”為賣貨
給用戶提供完整的開發(fā)工具,這一點并不只有北京人形想到了。
11月6日,宇樹科技發(fā)布了全身遙操作平臺,人類通過遙操設(shè)備能夠讓G1機器人復現(xiàn)人類的全身動作,包括洗碗、整理衣服、拳擊對練等動作。10月底,智元機器人正式推出首個0代碼、0門檻的機器人內(nèi)容創(chuàng)作平臺靈創(chuàng)平臺。
“現(xiàn)階段,同尺寸的機器人已經(jīng)很難拉開巨大的差距了,用戶為什么買你的機器人,不買其他家的,需要新的理由。”深圳一家機器人公司的高管Eddie(化名)告訴第一財經(jīng)記者,不同于今年年初,宇樹硬件表現(xiàn)出“斷層”的狀況,人形機器人行業(yè)在過去的十個月里,成長速度非常快。
他認為,各家專注的賽道不一樣,推出的開發(fā)工具也有所側(cè)重。“宇樹的硬件優(yōu)勢仍然在,遙操平臺的推出,也有機會讓宇樹獲得大規(guī)模、高保真的人類動作數(shù)據(jù),加速機器人AI側(cè)的閉環(huán)形成。”Eddie說,全身遙操平臺對于宇樹來說不僅僅是控制工具,也有可能是讓其突破表演場景的試水平臺。
智元的目標指向則更為明確。智元推出的靈心、靈創(chuàng)平臺主要用于租賃商等用戶能夠不用通過編程,來“自定義”機器人的運動表現(xiàn)和“人設(shè)”。
一位租賃商告訴記者,如果沒有這個平臺,想要讓機器人絲滑地跳一支舞,“哪怕只有三分鐘的時間,也可能需要兩三萬元”。智元機器人合伙人、高級副總裁、營銷服總裁姜青松告訴第一財經(jīng)記者,針對這兩個平臺,智元也設(shè)定了付費的機制。
“原先是第三方團隊賺的錢,企業(yè)現(xiàn)在要拿到自己手里賺。”
Eddie告訴記者,盡管平臺建設(shè)在前期意味著高投入和長周期,不僅要搭建算法與交互框架,還要投入人力去維護內(nèi)容生態(tài),但一旦用戶數(shù)量和內(nèi)容積累形成規(guī)模效應(yīng),回報將十分可觀。“后期的收益不僅來自軟件訂閱或功能付費,更重要的是用戶黏性的提升。”他說。
車正平告訴第一財經(jīng)記者,北京人形的慧思開物平臺則更多是從機器人應(yīng)用開發(fā)落地的痛點中倒推出來的。“不同的機器人作業(yè)環(huán)境、機械接口、任務(wù)節(jié)拍差異巨大,標準化算法往往‘下不去’,而完全定制又成本過高。”如果有一個平臺能夠解決“最后一公里”的落地問題,讓用戶能夠根據(jù)自身工位需求快速二次開發(fā)或集成新任務(wù)模塊,“那也會增強機器人本身的市場競爭力”。
“如果企業(yè)想要在資本側(cè)有一些大動作,商業(yè)化,也就是‘賣貨’的數(shù)據(jù)還是比較重要的。”Eddie說,這場由平臺化工具引發(fā)的新競爭,最終比拼的將不只是技術(shù)迭代的速度,而是誰能率先構(gòu)建起真正可持續(xù)的機器人生態(tài)。“對于企業(yè)來說,賣出去一個機器人只是開始,能不能讓它被持續(xù)使用、被更多人開發(fā)至應(yīng)用落地,才是更大的考驗。”
本文鏈接:拒絕第三方賺差價,機器人企業(yè)轉(zhuǎn)向二次開發(fā)http://www.sq15.cn/show-2-14283-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。