“這個大小已經可以解決80%的問題’
衡宇 發自 凹非寺
量子位 | 公眾號 QbitAI
專注、極致、口碑、快、成本。
這是瀾舟科技創始人兼CEO周明給出的“大模型落地九字法則”,是他在雷軍互聯網“七字訣”的基礎上,加上了“成本”一詞而來。

他將2024年稱為大模型落地元年,但同時堅定地表示,這并不意味著遍地是黃金。
而大模型的具體落地姿態,周明用自己帶領的大模型創業團隊瀾舟科技身先士卒地做了個表率——利用瀾舟“一橫N縱”體系,以孟子大模型為基礎,面向場景,發布產品。
簡單來說,就是抓技術和應用的雙輪驅動,在積極研究和掌握前沿技術的同時,致力于確保這些技術的有效應用。
3月18日的瀾舟大模型技術和產品發布會現場,瀾舟科技還與零一萬物進行了戰略合作簽約。

現場,創新工場董事長、零一萬物CEO李開復分享,目前世界上最好的大模型智能已經達到人類平均智力水平的3倍,也就是說,100道題普通人只能答對33道,而最好的AI大模型可以答對99道以上。
他展望了AI 2.0時代未來的四大趨勢:
- 最革命性的AI 2.0應用應該是AI-First / AI-Native:最終脫穎而出的應用,屬于那些敢于全力投入新技術的先驅者。大語言模型的引入為 AI-First 應用帶來了巨大的推動力。
- 大模型始于文本,未來將拓展至“全模態”:跨模態生成技術是實現認知和決策智能的轉折點。現實世界的信息是文本、音頻、視覺、傳感器以及人類各種觸覺的綜合體系,要更為精準地模擬現實世界,就需要將各種模態能力打通,例如文本-圖像、文本-視頻等跨模態甚至全模態的綜合能力。
- AI 2.0 將超越對話,從聊天工具到智能生產力工具:用戶體驗以及未來交互界面和商業模式都會發生大的變革。
- AI 2.0 將走向實體,大幅提振社會生產力:具身智能可以讓機器人制造機器人,進一步實現AI 2.0+生產線智能規劃。
專注研發10B-100B參數大模型
瀾舟科技成立于2021年6月,是國內最早一批下場,進行大模型創業的團隊。
去年3月,瀾舟發布了孟子GPT V1(MChat);今年1月,孟子大模型GPT V2(含孟子大模型-標準、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼)對公眾開放。
近期,瀾舟團隊完成了Mengzi3-13B的大模型訓練。

多說一句,孟子大模型訓練背后有個大功臣,即總規模3T tokens的Mengzi-3數據集,包含了網頁、代碼、書籍、論文等高質量數據來源。
據介紹,本月底(3月30日),Mengzi3-13B的模型將在GitHub、HuggingFace、魔搭和始智AI社區開源。
為什么開源的孟子大模型,是13B版本的?周明正面回答了這個問題。
首先,瀾舟明確以服務ToB場景為主,ToC為輔。
實踐發現,ToB場景使用頻率最高的大模型參數量多為7B、13B、40B、100B,整體集中在10B-100B之間。
其次,在這個區間范圍內,從ROI角度來講,既滿足場景需求,又最具性價比。
所以很長一段時間內,瀾舟的目標都是做好10B-100B參數規模范圍內的行業大模型。這就不能理解為什么開源版本選擇13B。
周明解釋道,他自己本身其實也是Scaling law的信仰者,但創業不同于科研。
“第一,這個大小的大模型已經可以解決80%的問題;第二,對團隊來說也比較穩定,不會因為不斷擴大的模型規模競賽而感到焦躁不安。”周明補充說,這樣冷靜的思考,可以保證良好的成本控制,避免無謂的GPU算力、數據、人力投入競賽。

“一橫N縱”體系
發布會上,瀾舟公布了自己的一橫N縱體系。
“一橫”是模型層,是孟子大模型技術基礎上研發的各個模型;
“N縱”則是基于孟子大模型的面向ToB應用最重要的技術和產品。
據了解,瀾舟目前重點投入到了金融行業,輔助編程等領域,旨在通過更加全面、專業、優質的領域數據,打造更加貼近行業場景的垂直大模型。

以孟子GPT通用大模型的“一橫”為基礎,瀾舟科技合伙人、首席產品官李京梅,介紹了瀾舟的應用能力型產品,包括:
- AI文檔理解:涵蓋專業的PDF文檔解析能力和信息抽取能力,為RAG方案中的文檔理解提供了更優的基礎能力;
- AI文檔問答:根據企業需要,提供私有化企業智能知識庫構建的解決方案能力;
- AI文檔輔助寫作:支持用戶上傳多個文檔作為參考資料,支持自定義多級題目和寫作提綱,由大模型賦能自動化按要求生成完整的文章初稿;
- 機器翻譯平臺:專注以中文為中心的世界主要語種之間互譯和20幾個領域的專業翻譯;
- 瀾舟智會:專注會議內容的智能分析和問答的產品, 是基于大模型打造的大模型原生的智能會議助手;
- 瀾舟AI搜索:大語言模型時代的搜索引擎。

過去一年,大模型領域日新月異。
OpenAI在干什么我們就去干什么,短期可以,長期不可取,一定要有自己的創新思路。
如何揚長避短,走出自己的獨特的創新之路,周明表達了自己的看法。
最關鍵的第一步,就是企業要有明確定位。瀾舟科技的定位就和國內其它大模型創業公司有明顯差異。
他舉例,瀾舟的定位就是作“大模型技術+企業場景應用”的綜合公司,“我們希望能做到站在技術角度最懂應用,站在應用角度最懂技術,同時又希望把技術和應用形成一種生態連接在一起,讓兩邊可以快速迭代。”

同時,依然需要聚焦和抓緊落地——通過落地,創造價值,拉動創新。
而且需要注意,創新和落地是相輔相成的。
不要一味的創新或者一味的落地,要把這兩者聯系在一起,讓它快速的迭代。
最后周明還語重心長地提醒:
今年是大模型落地元年,就遍地是黃金是嗎?不是的,我可以負責任地說,很多地方我們都沒有開拓出來。
比如大模型如何解決落地的最后一公里?大模型的商業模式是什么?如何加強交付能力?如何提高產品的商業化?
大模型落地的一切,其實才剛剛開始。
本文鏈接:瀾舟堅持四兩撥千斤:ToB場景落地,10B參數大模型足矣http://www.sq15.cn/show-2-4211-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。