21世紀經濟報道記者 董靜怡 杭州報道
在OpenAI發布ChatGPT后的22個月里,AI發展速度超過任何歷史時期。
在過去的一年多時間里,大模型技術進步迅速,現在能處理文本、語音、視覺等多模態任務,并執行復雜編程和高難度學科問題;推理成本指數級降低,已經遠遠超過摩爾定律,阿里云的API價格一年內下降97%。
盡管發展迅速,但依然處于AGI(通用人工智能)變革的早期。19日,阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘在云棲大會上表示,生成式AI最大的想象力,絕不是在手機屏幕上做一兩個新的超級app,而是接管數字世界,改變物理世界。
“當前,眾多企業在應用大模型時,已經遠遠不限于一個手機了?!卑⒗镌浦悄芗瘓F首席技術官周靖人向21世紀經濟報道記者表示,企業在整合模型能力與業務場景方面,已經拓展到更廣泛的設備和平臺,信息的輸入輸出與各種終端設備之間的交互日益增多。
本屆云棲大會,阿里云的重點從模型本身擴展到物理世界的應用落地,端側大模型的應用帶來更大的想象力。在論壇上,吳泳銘特別強調了自動駕駛和機器人這兩個熱門應用場景,大模型技術的賦能將為行業落地帶來變革。
“人們對新技術革命,往往對短期高估,又對長期低估?!眳怯俱懕硎?,“但新技術革命會在人們的懷疑中成長,讓很多人在遲疑中錯過。”
站在AGI的起點
在這一年多里,生成式AI加速發展。
投融資數據顯示,盡管去年人工智能私人投資整體下降,但對生成式人工智能的投資激增,該領域投資金額比2022年(約30億美元)增長近九倍,達到252億美元。生成式人工智能領域的主要參與者,包括OpenAI、Anthropic、Hugging Face和Inflection,都獲得了一輪可觀的融資。
國內外大模型加速迭代,呈現出以下特點:其一,參數量持續攀升,從百億到千億,甚至萬億,大模型的參數量不斷刷新紀錄;其二,多模態處理能力提升,大模型在處理文本、圖像、聲音等多種模態數據方面的能力不斷進步;其三,應用領域不斷拓展,大模型在醫療、金融、教育等眾多領域都展現出廣泛應用前景。
算力作為推動大模型持續迭代的關鍵因素,也在持續突破。英偉達、AMD等芯片制造商相繼發布了新一代GPU產品,這些高性能計算芯片為大模型的訓練和推理提供了強大動力。國內,以阿里云為代表的云計算巨頭紛紛升級其計算服務,推出了基于最新AI芯片的云計算實例,大幅提升了大模型訓練的效率。
“全世界先進模型競爭的投入門檻,將達到數十億、數百億美元的級別。”吳泳銘在論壇上表示,AI具備創造能力、幫助人類解決復雜問題的路徑清晰可見,也打開了AI在各行業場景中廣泛應用的可能性。
“很長一段時間,AI的焦點主要集中在模擬人類的感知能力,比如自然語言理解、語音識別、視覺識別。但是生成式AI的崛起,帶來了質的飛躍,AI不再僅僅局限于感知,而是首次展現了思考推理和創造的力量?!眳怯俱懕硎?。
過去三十年,互聯網連接了人、信息、商業和工廠,通過連接提高了世界的協作效率,創造了巨大的價值,改變了人們的生活方式。而生成式AI是通過生產力的供給創造了新的價值,提高了整個世界的生產力水平。這種價值創造,可能是移動互聯網連接價值的十倍、幾十倍。
吳泳銘認為,AI最大的想象力不在手機屏幕,而是接管數字世界,改變物理世界?!拔覀冋J為生成式AI將逐漸滲透數字世界,并接管數字世界,物理世界的大部分事物都會具備AI能力,形成下一代的具備AI能力的全新產品,并與云端AI驅動的數字世界連接產生協同效應。”吳泳銘表示。
在他看來,AI模型可以通過對物理世界數據的Token化,理解真實世界的方方面面,比如人類行走、奔跑、駕駛車輛、使用工具,繪畫、作曲、寫作、表達、教學、編程的技巧,甚至是開公司創業。理解之后,AI就可以模仿人類去執行物理世界的任務。這將帶來新的產業革命。
“可以想見,AI驅動的數字世界連接著具備AI能力的物理世界,將會大幅提升整個世界的生產力,對物理世界的運行效率產生革命性的影響。”吳泳銘表示。
突破自動駕駛的上限
如何改變物理世界?自動駕駛是一個重要領域。
9月19日,小鵬汽車董事長CEO何小鵬駕駛“全球首款AI汽車”P7+亮相2024云棲大會,這款車搭載了業內領先的端到端大模型。過去2年,小鵬汽車與阿里云共建的AI算力規模提升超4倍。
大模型滲透端側,汽車行業正在發生這樣的變革。
自動駕駛技術,包括現有算法,主要基于規則。NVIDIA全球副總裁、汽車事業部負責人吳新宙表示,現有的算法棧通常包含許多由人類工程師設計的信號,例如,自動駕駛系統需要知道其他車輛的位置、速度和加速度,甚至需要精確到極高的程度,以便在三維空間中進行規劃。然而,這種基于人類設計的信號或特征往往會限制算法棧的性能上限。
其一,行為量化。吳新宙表示,人類駕駛行為具有高度的靈活性,而基于規則的自動駕駛算法棧往往會過度量化人類行為。盡管算法??赡馨喾N行為狀態,但量化的行為往往導致車輛駕駛顯得機械。
其二,通用性限制。為了訓練模型,尤其是感知模型,需要大量的數據集來快速修復特定的Corner case(邊緣情況),這導致了巨大的工程量和測試量。而算法的通用性在面對未見過的數據時會受到挑戰,當遇到數據覆蓋不足的罕見場景,車輛可能無法正確反應。
其三,邏輯推理能力。駕駛主要涉及小腦問題,通常不需要復雜的邏輯推理。但在處理Corner case時,邏輯推理是必要的?,F有的算法棧在時間記憶和邏輯推理方面的能力較弱。
通過“端到端”大模型的應用,上述限制可以得到有效解決。吳泳銘在論壇上表示,人工智能模型能夠直接從海量的人類駕駛視覺數據中學習,從而賦予汽車超越大多數駕駛員的駕駛技能。
吳新宙表示,數據驅動的方法可以使車輛行為更加擬人化。大模型通過互聯網量級的數據訓練,對物理世界的理解遠超汽車駕駛場景,從而顯著提升自動駕駛的性能上限。此外,大模型在時序和空間上的強關聯能力,能夠形成強大的記憶能力,有效解決邏輯推理問題。
“端到端的大模型幫助我們可以將未來的自動駕駛的高度做得更高,且下限也可以得到提高?!焙涡※i在論壇上表示,“對于最普通的用戶,從現在到未來的36個月,可以讓我們每一個人在每一個城市都像老司機一樣開車,這是端到端大模型對于用戶的一個強感知。”
今年5月,小鵬汽車就在國內率先實現端到端自動駕駛量產上車,并在全國范圍內迅速落地。業界普遍認為,未來端到端智駕的算力需求還將進一步擴大,上億元投入僅是智駕算力的入場券。
機器人泛化的基礎
機器人行業也是下一個迎來巨變的行業。
事實上,在一些特定領域,如工業機器人、服務機器人等,其應用已經非常成熟,可以通過編好的程序替代人力高效完成工作。但業內對于機器人的期待顯然不止在于特定場景的特定任務,更高的泛化性、更強的智能能力是機器人大規模應用的基礎。
“為什么現在具身智能還是感覺這么智障,就是因為它沒有靈魂,它沒有腦子。”個人開發者、知名技術博主張子豪向21世紀經濟報道記者表示。
盡管一些機器人的神經系統、控制系統、感知系統以及骨骼、關節和電機可能非常先進,但它們缺少類似于人腦的高級認知功能。因此,許多機器人只能停留在基礎的操作層面,無法執行更復雜的任務,常常需要外部控制,無法實現真正的自主應用。
而大模型的融入則使得機器人的“大腦”更加智能,與人類的交互更加順暢。張子豪向記者表示,傳統機器人缺乏泛化能力、多樣性和對通用指令的理解,而AGI能夠將任意指令轉換為機器人的動作。簡而言之,大模型可以直接調用程序接口,給機器人發指令,調度機器人執行動作。
同時,它們能夠理解大量世界的先驗知識,并具備對三維物理世界的理解。張子豪舉例稱,曾試驗讓機械臂將一個綠色方塊移動到“李云龍”的臉上,而機器人真的能夠識別出“李云龍”。
在以往的模型中,這是不可能實現的,因為要讓機器人識別需要專門訓練一個模型,并使用特定的數據集進行訓練。但現在,借助多模態大模型,機器人天生就具備了這種能力。
這種泛化和通用性是機器人規模應用的基礎。吳泳銘在論壇上表示,未來,所有可移動的物體都可能轉變為智能機器人,這些機器人可能包括工廠中的機械臂、建筑工地上的起重機、倉庫內的搬運工、火災現場的消防員,以及家庭中的寵物狗、保姆和助理等。
不過,把機器人完全交給大模型做“甩手掌柜”也是行不通的。某初創機器人企業負責人向記者表示,很多時候大模型的意圖理解是不穩定的,很多任務還是依托于局部小模型。
“小模型目的就是提升具體場景下某些任務執行的精確可靠,大部分都是定制化的。它們場景明確,數據可靠,有針對性的訓練。”該負責人表示,這也考驗著不同機器人企業的能力。
而大模型可以與小模型結合應用,更好地發揮小模型能力。北京大學助理教授、北大-銀河通用具身智能聯合實驗室主任王鶴在論壇上表示,大型模型可以充當監控器(Monitor),在小型模型執行任務的過程中,實時監控其表現,確保任務正確無誤地進行?!氨热缢幒胁簧鞯袈?,大模型能夠及時識別問題,并采取措施,指導機器人撿起藥盒?!?span style="display:none">aNj速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM
未來,業內仍然期待能將通用感知、規劃和執行能力融合在一起的大模型賦能機器人,使其能夠更智能、更靈活地執行各種任務。
正如吳泳銘所設想,“未來,工廠里會有很多機器人,在AI大模型的指揮下生產機器人?,F在每個家庭里有一兩輛車,未來每個家庭可能會有兩三個機器人,幫助人們提升生活當中的效率?!?span style="display:none">aNj速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM
本文鏈接:改變物理世界,從云棲大會看AI的下一代變革http://www.sq15.cn/show-2-8514-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。