21世紀經濟報道記者孔海麗、實習生鄧熙涵 北京報道
大模型競速,企業仍在加碼。
近日,谷歌旗下人工智能大模型Gemini Pro已向歐洲用戶開放,欲與ChatGPT分天下。另據谷歌母公司Alphabet首席執行官Pichai在財報電話會上透露,號稱最強AI模型的“Gemini Ultra”將很快面世。
與此同時,長期缺席大模型的蘋果似乎也有意入局,或將推出嵌入生成式AI的iOS 18,提升Siri在自動問答方面的完整性。
慢半拍的蘋果能否再次開啟“iPhone時刻”,仍未可知,但可以肯定的是,2023年刮起的“大模型熱”,2024年仍將蔓延。
頭號玩家加速領跑
被比爾蓋茨稱為“將改變我們的世界”的ChatGPT,依舊是群雄爭霸的先行者,其開發者OpenAI,在過去一年占據話題C位,大模型能力和商業化實力都在進化。
2023年1月末,發布僅兩個月,ChatGPT便獲得1億月活用戶,使其成為歷史上增長最快的消費者應用程序。隨后OpenAI乘勢而上推出ChatGPT Plus的訂閱服務,開啟了付費時代。
對于一家初創公司,GPT能否順利承載大量用戶涌入,類似的質疑與爭辯不絕于耳。2023年3月15日凌晨,OpenAI發布最新大模型應用成果GPT-4,并率先開放ChatGPT Plus用戶使用,宣告大模型多模態時代的到來。
GPT-4在模擬律師考試、美國高考SAT等職業和學術測試中表現不俗,語言測試準確度大幅提高。
此外,OpenAI也優化了GPT-4模型的安全性能,不允許其技術被用于生成仇恨、騷擾、暴力或成人內容。官方數據顯示,相比GPT-3.5,GPT-4響應禁止內容請求的可能性降低了82%。
隨后,具有視覺功能的GPT-4V、六維度突破的GPT-4Turbo相繼問世。
受益于日益成熟的技術底座,OpenAI的大模型系列落地扎根。2023年11月10日,OpenAI推出GPTs功能,無需復雜的代碼,任何人都可使用自然語言構建和微調定制化的模型,并將專屬模型上傳到GPT Store。科創者更易部署GPT盈利,零基礎小白也能訓練出自己的AI Agent,GPTs這步棋似乎為大模型的服務生態打開了新的象限。美國時間2024年1月11日,OpenAI官宣GPT Store(GPT商店)正式上線,OpenAI聯合創始人Sam Altman將其稱為“人工智能領域的蘋果應用商店”。
如今,經歷“逼宮”鬧劇最終安然回歸的Sam Altman,將帶領OpenAI走向何方,也為大模型競爭格局增添了幾許不確定性。
曾經向OpenAI追加100億美元投資的微軟也是本輪浪潮的發起者之一,正探路大模型商業化和自家應用的落地實踐。
2023年2月,微軟快速將大模型技術融入搜索引擎Bing,New Bing煥新檢索路徑,以聊天框取代搜索框。第三方機構data.ai數據顯示,New Bing的全球下載量一夜激增10倍。同年5月,微軟再度升級Bing,推出基于GPT-4的Bing Chat。但流量增加并未顯著提升搜索引擎背后的廣告收益。
微軟的大模型布局,也在向辦公軟件發力。2023年3月16日,微軟正式宣布推出Microsoft 365 Copilot,將Microsoft Graph和GPT-4大模型的力量與微軟365軟件生態進行結合。在此后召開的Ignite2023大會上,微軟更是直接發布了Copilot Studio,用戶可以直接在Studio中構建和發布插件,無縫搭載OpenAI的模型服務,一定程度上更新了大模型時代人機交互的方式。
谷歌雖然在AI大模型市場部署中錯失先發機遇,但也在過去一年間,加速大模型技術向產品的轉化。2023年3月,谷歌推出當時全球最大視覺語言模型PaLM-E,隨后為基于LaMDA模型的聊天機器人Bard開啟全球公測,對標ChatGPT展開競賽。5月的I/O2023開發者大會上,全新的AI語言模型PaLM2亮相。據悉,訓練該模型的文本數量幾乎是訓練其前身模型的五倍,經過100種語言的“錘煉”,PaLM2可以使產品和功能全面AI化。
去年12月,谷歌鋪墊許久的Gemini1.0才正式走到聚光燈下,根據谷歌發布的基準測試,在32項性能測試標準中,Gemini有30項得分超過了GPT-4。但Gemini的演示視頻,被普遍質疑是一個精剪合輯,有炒作營銷的嫌疑。隨后,Google DeepMind的研究副總裁Oriol Vinyals承認,視頻中的所有人類提示和AI輸出都是真實的,但為簡潔起見進行了縮短。
不久的將來,谷歌或將推出Gemini UltraAI模型,相比Gemini1.0或許有明顯的升級與進步。正在緊鑼密鼓訓練大模型的谷歌,距離其“提供世界上最先進、最安全、最負責任的AI”的目標還有多遠仍是未知數,但谷歌背靠最龐大的搜索數據庫,具有海量用戶優勢,這是其大模型發展之路上不容忽視的重要加持。
擁抱開源是社交巨頭Meta布局大模型的路徑,使得Meta在OpenAI、谷歌主導的AI閉源世界之外,重新開辟了一片天地。Meta在2023年5月發布了開源大模型LLaMA,投身模型之戰。同年7月升級版大模型LLaMA2宣布免費可商用。同年7月,Meta發布可跨6種不同模態的模型Image Bind。2024年1月29日,Meta發布開源大模型CodeLlama70B,測試結果超越了Llama2。
Meta憑借開源的LLaMA系列模型,在業界建立了廣泛的影響力,許多國際公司都部署了基于LLaMA的開源模型。
2023年四季度財報顯示,Meta獲得了25%的營收增長,這也是其自2021年三季度以來的最大季度增幅。Meta首席執行官馬克·扎克伯格指出,Meta在推動人工智能和元宇宙愿景方面取得了很大進展。
商用價值考驗國內“百模”
《2023-2024年中國人工智能計算力發展評估報告》顯示,截至2023年10月,中國累計發布200余個大模型,老牌互聯網大廠、科技型企業、科研機構與高校紛紛入局,一邊發力提升大模型能力邊界,一邊夯實產品建設,呈現出井噴式的“百模競發”。
熱鬧非凡的國內賽道中,百度是第一個將大模型產品對標ChatGPT的破壁者。
2023年3月16日,百度發布了大語言模型、生成式AI產品文心一言。目前文心一言4.0已實現理解、生成、邏輯和記憶能力的提升。百度也對旗下搜索、推薦、地圖、如流等產品開刀,接入了大模型。截至目前,文心一言用戶規模突破了1億人。
大模型的技術洋流同樣裹挾著阿里,經歷了業務層面的調整,阿里在去年4月正式宣布推出大語言模型通義千問,又在年中上架了兩款開源模型Qwen-7B和Qwen-7B-Chat。作為國內第二家拿出大模型的頭部大廠,阿里更信仰開源,迄今共開源18億、70億、140億、720億參數的4款大語言模型,阿里云稱之為“全尺寸,全模態”開源。
據報道,大模型訓練人員在阿里國際商業集團的AIBusiness團隊構成中超1/3,大模型可以實現智能“貨找人”,研制自如對話的AI客服,進一步解決跨境電商本地化問題。去年11月,阿里智能信息事業群也發布了夸克大模型,先后推出“健康助手”“講題助手”“元知”等基于搜索場景的AI產品,把大模型能力融入到網盤、掃描、聽記等智能工具產品中。
騰訊是BAT三巨頭中最為謹慎的一個,自研的混元大模型在2023年下半年才浮出水面,并于同年11月正式對外開放“文生圖”功能。騰訊將混元大模型的特色表述為:擁有超千億參數、預訓練語料超2萬億tokens、降低30%-50%的幻覺率。騰訊內部消息透露,已有超過180個騰訊內部業務已接入騰訊混元,并依托騰訊云TI平臺打造行業大模型精選商店,提供一站式大模型服務。2024年,騰訊還將進行規模化的復制,從實際落地場景切入,早日進入大模型商業化。
除了互聯網大廠,科大訊飛、智譜·AI、商湯科技也是大模型市場的重要參與者。今年1月30日,科大訊飛發布了星火認知大模型V3.5。
數據研究和分析機構Gartner預測,到2026年超過80%的企業將使用生成式AI的API(應用程序編程接口)、模型,或在生產環境中部署支持生成式AI的應用,而在2023年初這一比例不到5%。
如果對標國際巨頭,國內各式各樣大模型的實際能力,網友們見仁見智。與此同時,大模型的商用也面臨著一系列挑戰。研發成本高昂、落地場景不明晰、部署成本高等問題,困擾著大模型的商業化進程。
如果說2023年是大模型研發的元年,2024年則是大模型應用的元年,大模型的研發企業們能不能讓更多用戶買單,讓大模型形成良性循環,仍未見到明確答案。
一位AI研究專家對本報記者說,國內的“百模”有不少是趕潮流玩概念,包裝出來的,其實際價值業內也是有爭議的。出水才看兩腿泥,商用才是試金石。可以預測的是,進入2024年,淘汰賽開始了。
本文鏈接:萬物皆可AI 國內“百模”邁入淘汰賽丨AI應用之道②http://www.sq15.cn/show-2-2776-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。