21世紀經濟報道記者 馮戀閣 王俊 實習生孔雅萱 廣州、北京報道
開源還是閉源?這是屬于大模型的時代之問。
今年年初,埃隆·馬斯克在對OpenAI及其CEO薩姆·奧特曼提起訴訟時,就對OpenAI逐漸不公開其模型研究相關細節的行為大加譴責。“時至今日,OpenAI公司網站還宣稱,它的宗旨是確保通用人工智能造福全人類。然而,在現實中,OpenAI已經轉變為科技巨頭微軟事實上的閉源子公司。”這位曾經的OpenAI聯合創始人如此表示。
OpenAI不夠“Open”,Meta卻“Open”了自己最新的開源人工智能模型。
4月18日,Meta 發布了其最新版本的開源大模型 Llama 3,引起開源AI社區的一陣歡呼。巧合的是,Llama 3發布當天正好是AI領域頂尖學者、AI開源倡導者吳恩達的生日。“(Llama 3是)至今為止最好的禮物,謝感謝Meta!”他說。
行至2024,開閉源之爭日漸白熱化。閉源陣營以目前最強的OpenAI為代表,開源陣營Meta的LLaMa、Mistral和Google等也在不斷迭代。閉源陣營堅持對Scaling Law的信仰,押注在更強通用模型的打造上;開源陣營模型能力不斷提升,并且強調以更垂直的性能、更靈活的配置來推動大模型商業化落地。
關于應該選擇模型開源還是閉源討論經久不息。
對于局內人,這一選擇這不僅決定了他們將如何點亮AI“科技樹”,更將影響他們的商業路線選擇。換言之,這很有可能是這個殘酷競爭市場下的生存問題。
兩個版本,多重驚喜
Meta此次發布的Llame 3包括8B和70B的預訓練和指令微調版本。
據Meta官網信息,Llama 3 模型將數據和規模提升到新的高度。它在兩個定制24K GPU集群上基于超過 15T 的數據進行了訓練——訓練數據集是Llame 2使用量的7倍有余。它支持 8K 上下文長度,是 Llama 2 容量的兩倍。
除了 Llama 3,Meta 還發布了新的信任和安全工具,包括Llama Guard 2、Code Shield和 CyberSec Eval 2。
據悉,Llama 3 即將在AWS(Amazon web service)、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主要云提供商、模型 API 提供商平臺上線,Llama還得到AMD、AWS、戴爾、英特爾、NVIDIA和高通提供的硬件平臺的支持。
在官網上,Meta還放出了Llama 3兩個版本與谷歌Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等競爭對手的參數對比。據Meta官網,Llame 3在MMLU(學科知識理解)、GPQA(一般問題)、HumanEval(代碼能力)、GSM-8K(數學能力)、MATH(比較難的數學問題)5個評測集上均表現良好。
值得注意的是,Llama3的代碼能力非常優秀。
在AI領域公眾號“數字生命卡茲克”主理人卡茲克分享的用戶實測中,Llama3-8B能夠給出國際象棋中經典皇后問題的解題代碼。而其前代版本Llama2需要專門的代碼模型才能實現。
市場的反應速度很快。18日當天,Meta股價逆勢收漲1.54%。次日,百度智能云千帆大模型平臺開放邀約測試,提供針對Llama 3的訓練推理方案,幫助開發者訓練專屬大模型。
8B 和 70B 兩個型號的模型,僅僅標志著 Llama 3 系列的開端,Meta AI首席科學家楊立昆在其社交媒體透露,在接下來的幾個月,還會有更多版本陸續發布。
英偉達高級科學家Jim Fan認為之后可能會發布的Llama 3-400B以上的版本將成為某種“分水嶺”,開源社區將能用上GPT-4級別的模型。
不下牌桌,各顯神通
上一輪元宇宙競爭中被認為可能跌進坑里的Meta,在人工智能的牌桌上打出了Llama系列這把好牌。要討論Llama3帶來的行業震蕩,首先要明白,什么是大模型領域的開源?
大模型領域的開源通常意味著模型的架構、訓練代碼和預訓練權重等都被公開,允許研究人員和開發者自由地訪問和使用。
不過,開源的程度因模型而異。“有些可能只提供有限的訪問權限或部分代碼。”郭濤指出,判斷大模型是否真正開源的基準可能包括:代碼和數據的可訪問性、使用許可的寬松程度、社區支持的活躍度以及對改進和新應用的開放性。
放眼AI界,兩條路徑上都各有“頭號玩家”分布。閉源自不必說,海外有OpenAI旗下的ChatGPT,國內是百度的文心一言以及風頭正勁的月之暗面Kimi。
而開源方面,除了Llama系列,目前應用較廣的開源大模型還包括非營利組織LAION推出的OpenFlamingo、Databricks的Dolly,以及MosaicML的MPT等。國內則包括,阿里巴巴的通義千問,智譜的ChatGLM-4、百川智能的baichuan-7B中英文大模型、北京智源悟道3.0大模型系列和面壁智能的CPM-Bee 10B中文基座大模型等。
形成這樣的分化,很多時候是受技術進步和商業模式迭代等的多重影響。
天使投資人、資深人工智能專家郭濤認為,從技術角度來看,開源可以促進學術界的研究和創新,而閉源則有助于在一定時間內保持技術領先優勢。
從商業角度來看,開源可以吸引開發者社區的貢獻,促進技術的快速迭代和應用的廣泛傳播,但可能會影響到公司的盈利模式。閉源則可以保護知識產權,為公司創造直接的收入來源,但可能會限制技術的普及和生態的建設。
事實上,在Llama3發布之前,中文互聯網剛剛經歷了一輪開閉源論戰。
據媒體報道,百度CEO李彥宏近日表態,認為大模型開源意義不大,閉源模型性能會不斷提升。“有了文心大模型4.0,我們可以根據需要兼顧效果、響應速度、推理成本等各種考慮,裁剪出適合各種場景的更小尺寸模型,且支持精調和post pretrain。通過降維裁剪出的模型,比直接拿開源調出來的模型,同等尺寸下效果更好,同等效果下成本明顯更低。”
李彥宏一直是閉源路線的忠實擁躉,理由包括但不限于認可閉源商業模式可以更好地聚集人力和財力等。
而其反對者——360創始人周鴻祎言簡意賅,“一句話,今天沒有開源就沒有 Linux,沒有 Linux 就沒有互聯網。”
“源神”啟動,影響幾何?
“Llama 3的發布會帶來市場格局的改變。”郭濤在接受21記者采訪時指出,其優異表現可能吸引更多的用戶和投資者,從而增加其市場份額。
官網顯示,Llama 3將有條件地開源給商業使用(月活用戶超過7億需要單獨申請)。“不過這基本等于完全免費商用了。”卡茲克表示。
此前,投資人朱嘯虎曾經就人工智能市場相關話題接受騰訊新聞采訪。當被問及2023年大模型發展的關鍵節點時,他給出的回答正是Llama上線。這讓中國在應用層面創新有了基礎,降低了商業化門檻。
當然,朱嘯虎提到的變現是指開源生態內的用戶。對于開源大模型發布者的能否盈利,或者能等來盈利機會,很多時候并沒有確定的答案。
閉源大模型通常通過授權使用、訂閱服務或者直接銷售產品來盈利。其中的代表便是AI領域的領跑者OpenAI,雖然其一直有推進開源項目的動作,但其處在核心地位的ChatGPT卻一直采取收取API許可費的方式向其他公司提供服務。在API服務過程,其他公司不會接觸到ChatGPT模型的細節和源代碼,僅僅通過API接口進行調用。
創業者服務平臺GoDaddy對全美1003家小型企業的調查數據顯示,ChatGPT以70%的應用率成為美國小型企業應用最多的生成式AI產品,這說明OpenAI選擇的閉源模式的商業化之路在一定程度已經跑通。
開源模型如何尋求生存和發展的機會?
首先是以開放的生態吸引用戶。國盛證券研報就指出,開源大模型借助更大標識符訓練數據集、DeepSpeed、RLHF等方式,實現低訓練成本和高性能,超大模型以下大模型的壁壘正在消失。
“在擁有用戶后,開源大模型通常通過提供增值服務、定制開發、技術支持等方式來實現盈利”。郭濤指出,公司可以在開源模型的基礎上提供專業的訓練服務或者定制化的應用解決方案。
對于Meta甚至眾多開源者而言,開源的野心不僅是短期的商業變現,其更想引領規則設計以及搭建生態。 有業內專家分析,開源后壁壘并沒有那么容易破除,高質量、標注過的訓練數據集尤其是專業模型的壁壘。
星紀魅族集團數據合規執行總監朱玲鳳表示,目前有些開源AI由頭部公司主導,“越多人使用,就越能強化網格效應,而且不是真正的開放,后續需要使用它們的配套工具、配套服務。頭部公司還可能利用監管豁免的方式,獲得尋租空間。”換言之,以開源為噱頭的巨頭游戲,可能會進一步強化大公司的壟斷地位,反而不利于產業競爭。
據報道,去年4月,在扎克伯格與分析師的一次電話會議中,他就談到,如果行業能夠在Meta使用的基礎工具上達成標準化,那么meta就能從其他人的改進中受益。同年5月,谷歌內部泄露的文件《我們沒有護城河,OpenAI也沒有》在SemiAnalysis網站上傳播,其中的觀點包括,比起開源社區需要谷歌,谷歌更需要開源社區等等。文章作者指出,不同開源模型所組成的生態系統永遠是OpenAI的潛在競爭對手,與開源AI競爭的結果必然是失敗。
Meta落子,戰局生變。大模型的路線之爭會不會迎來真正的勝利者?
“開源與閉源大模型之間不太可能分出絕對的輸贏,因為它們各自適合不同的應用和場景。”郭濤認為,開源大模型更適合那些需要快速創新和大規模協作的項目,而閉源大模型可能更適合那些對性能和安全性有極高要求的商業應用。
本文鏈接:AI“源神”啟動!Llama 3發布,開閉源之爭戰局生變http://www.sq15.cn/show-2-5196-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。