中文字幕亚洲欧美一区二区三区_亚洲精品菠萝久久久久久久_日本成人免费视频_狠狠躁少妇一区二区三区_国产精品中文字幕久久久_国产乱子伦农村叉叉叉_麻豆tv免费在线观看_av在线这里只有精品_色吧亚洲视频_嫩草影院一二三

設置
  • 日夜間
    隨系統
    淺色
    深色
  • 主題色

模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了

2024-03-26 17:07:23 來源: 量子位

英偉達科學家:最有想象力的論文BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

豐色 發自 凹非寺BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

量子位 | 公眾號 QbitAIBnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

把Huggingface上的現成模型拿來“攢一攢”——BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

直接就能組合出新的強大模型?!BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

日本大模型公司sakana.ai腦洞大開(正是“Transformer八子”之一所創辦的公司),想出了這么一個進化合并模型的妙招。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了

該方法不僅能自動生成新的基礎模型,而且性能絕不賴BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

他們得到的一個70億參數的日語數學大模型,直接在相關基準測試上取得了SOTA,打敗了700億參數的Llama-2等前輩。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

最重要的是,得出這樣的模型不需要任何梯度訓練,因此需要的計算資源大大減少。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

英偉達科學家Jim Fan看完大贊:BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

這是我最近讀過的最有想象力的論文之一。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了

合并進化,自動生成新基礎模型

從開源大模型排行榜上表現最好的模型,大多不再是LLaMA或Mistral這種“原始”模型,而是一些微調或合并模型之后,我們就能看出:BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

一種新的趨勢出現了。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

Sakana.ai介紹,開源基礎模型很容易在數百個不同的方向上進行擴展和微調,然后產生在新的領域表現出色的新模型。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

而在這之中,模型合并顯現出了巨大前景。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了

但,它可能是一種“黑魔法”,嚴重依賴直覺和專業知識。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

因此,我們需要更為系統性的方法。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

受自然界的自然選擇啟發,Sakana.ai盯上了進化算法,引入“進化模型合并”(Evolutionary Model Merge)的概念,提出一種可以發現最佳模型組合的通用方法。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

該方法結合了兩種不同的思路:BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

(1)合并數據流空間(層)中的模型,以及(2)合并參數空間(權重)中的模型。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

具體而言,第一種數據流空間方法是通過進化來發現不同模型層的最佳組合,以此形成新模型。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

在社區以往的做法中,都是靠直覺來確定如何以及模型哪些層可以與另一個模型的層結合。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

但其實,Sakana.ai介紹,這個問題有一個組合數量巨大的搜索空間,最適合由優化算法如進化算法來搜索。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

其操作示例如下:BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了

至于第二個參數空間方法則混合多個模型權重來形成新模型。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

這種方法其實很無數種實現,再加上混合的每一層原則上可以使用不同的混合比例,就更多了。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

而這,利用進化方法就可以有效地找出更為新穎的混合策略。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

以下是將兩個不同模型的權重進行混合得到新模型的操作示例:BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了

將以上這兩種方法合并,就是這樣的:BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了

作者介紹,他們希望在相距較遠的領域,例如數學和非英語語言、視覺和非英語語言,來組成之前大家不曾探索過的新興組合。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

結果,還真有點讓人驚喜。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

新模型輕松拿下SOTA

用以上進化合并方法,團隊得到了3個基礎模型:BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  • 大語言模型EvoLLM-JP

由日語大模型Shisa-Gamma和數學大模型WizardMath/Abel合并而成,擅長解決日語數學問題,進化了100-150代。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  • 視覺語言模型EvoVLM-JP

日語大模型Shisa Gamma 7B v1+LLaVa-1.6-Mistral-7B,是具有日語能力的VLM。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  • 圖像生成模型EvoSDXL-JP

支持日語的SDXL擴散模型。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

前兩個已在Hugging Face和GitHub上發布,最后一個也即將推出。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

具體來看。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

1、EvoLLM-JPBnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

它在GSM8K數據集的多語言版本——MGSM的日語評估集上取得成績如下:BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了

可以看到,EvoLLM-JP用日語解決數學問題的表現超過了它們的原始模型,也超過了Llama-2、GPT-3.5等高性能模型。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

其中模型4是僅在參數空間進行了優化,模型6是使用模型4在數據流空間中進一步優化的結果。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

在既評估數據能力也評估一般日語能力的日語lm-evaluation-harness基準上,EvoLLM-JP則在9個任務上的平均得分最高達到了70.5——只用70億參數,它就打敗了700億的Llama-2等模型。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了

團隊表示,EvoLLM-JP已經足夠優秀,可以作為通用日語大模型,并解決一些有趣的例子:BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

比如需要特定日本文化知識的數學問題,或者用關西方言講日本笑話。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

2、EvoVLM-JPBnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

在以下兩個圖像問答的基準數據集上,分數越高,代表模型用日語回答的描述越準確。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

結果,它不僅比其所基于的英語VLM LLaVa-1.6-Mistral-7B更出色,也比現有的日語VLM更厲害。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了

如下圖所示,在回答圖中的信號燈為什么顏色之時,只有EvoVLM-JP答對:藍色。(日本的習俗就是把紅綠燈稱為紅藍燈)BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了

3、EvoSDXL-JPBnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

這個支持日語的SDXL模型只需4個擴散模型即可執行推理,生成速度相當快。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

具體跑分還沒出來,但團隊透露也是“相當有希望的”。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

可以欣賞一些示例:BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

提示詞包括:味噌ラーメン、最高品質の浮世絵、葛飾北斎、江戸時代。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了

對于以上3個新模型,團隊指出:BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

原則上,我們可以采用基于梯度的反向傳播來進一步提高以上這些模型的性能。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

但我們不用,因為現在的目的就是表明,即使沒有反向傳播,我們仍然可以得到足夠先進的基礎模型,挑戰當前的“昂貴范式”。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

對此,網友們紛紛點贊。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

Jim Fan也補充:BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

在基礎模型領域,目前社區幾乎完全專注于讓模型去學習,而不太重視搜索,但后者在訓練(也就是本文提出的進化算法)和推理階段其實都有巨大的潛力。BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

所以,如網友所說:BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

我們現在已經處于模型的寒武紀大爆發時代了嗎?BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了

論文地址:
https://arxiv.org/abs/2403.13187BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM
參考鏈接:
[1]https://sakana.ai/evolutionary-model-merge/BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM
[2]https://twitter.com/DrJimFan/status/1771927650883522899?s=20BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM
[3]https://twitter.com/SakanaAILabs/status/1770613032198279663BnM速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

本文鏈接:模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了http://www.sq15.cn/show-2-4239-0.html

聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

上一篇: 《宮保雞丁》殺入全球AI音樂榜前十!音樂版ChatGPT被玩瘋了

下一篇: 兆級長文本,已是一線大模型機構標配能力丨上海AI Lab林達華

熱門資訊

  • 我國科學家在鐵電隧道結存儲器研究中取得新進展

    記者從中國科學院金屬研究所獲悉,該所沈陽材料科學國家研究中心胡衛進研究員與合作者,提出利用緩沖層定量調控薄膜應變,延遲鐵電薄膜晶格弛豫從而增強

  • 監管AI,歐盟出手,美國掉隊?

      監管AI,歐盟出手,美國掉隊?  上個世紀,科幻小說家艾薩克?阿西莫夫提出了“機器人三定律”,帶來了對“機器人”與“規則”的美好幻想。  如今,伴隨著ChatGPT、Sora的爆火,

  • 創新中藥八子補腎膠囊抗衰老研究取得重大突破

    3月20日對于我國抗衰老研究是個特殊的日子,經過近3年的不懈努力,八子補腎膠囊抗衰老取得又一重大突破。挑戰人類生命極限是擺在全球科學家面前的重大

  • 什么是“時空連續體”?

    英國“我超愛科學”網站1月1日刊登題為《什么是“時空連續體”?》的文章,作者是斯蒂芬·倫茨,內容編譯如下:“時空連續體”(space-time continuu

  • 人工智能重新定義職場技能

    據阿根廷布宜諾斯艾利斯經濟新聞網2月19日報道,在人工智能(AI)迅速重新定義就業格局的今天,通常被稱為“軟”技能的人類技能成為最有韌性、最有價值

  • 肺癌蛋白質致命弱點發現

    肺癌是全球死亡率最高的惡性腫瘤。其中非小細胞肺癌(NSCLC)占比達到85%。表皮生長因子受體(EGFR)是NSCLC最常見的驅動突變基因。現在,一個國際科學家團

  • “類腦”無線網絡可處理數千微芯片數據

    美國布朗大學研究團隊在最新一期《自然·電子學》上描述了一種無線通信網絡。它可有效地傳輸、接收和解碼來自數千個微電子芯片的數據。研究

  • 甘肅首座特高壓換流站迎來“新成員”

    3月18日,伴隨著搬運車的轟鳴聲,全國首個大規模清潔能源特高壓直流輸電工程的送端±800千伏特高壓祁連換流站迎來了一位“新成員”—&mdas

  • 太空培育類器官或帶來疾病新療法

    自2019年以來,科學家已經在國際空間站上培育出了包括人類大腦、心臟和乳房在內的多個類器官模型。這些類器官通常利用人類干細胞培育而成,在一系列化

  • 英國2026年試飛電動“飛的”

    據英國《每日電訊報》網站3月18日報道,根據英國政府的新航空計劃,首批電動飛行出租車將于2026年試飛。周一發布的《“飛行未來”行動計劃》為飛行出

  • 我國網民規模達10.92億人 互聯網普及率達77.5%

    3月22日,中國互聯網絡信息中心(CNNIC)發布第53次《中國互聯網絡發展狀況統計報告》(以下簡稱《報告》)。《報告》顯示,截至2023年12月,我國網民規模達10.9

  • 北京首例負碳示范建筑正式亮相

    3月22日,在2024低碳建筑產業論壇上,北京首例負碳示范建筑——首程時代中心負碳示范建筑正式亮相。活動現場,中國建筑節能協會、北京綠色交

推薦資訊

  • 日榜
  • 周榜
  • 月榜
欧美1卡一卡二卡三新区| 成人a级高清视频在线观看| 日韩中文字幕一区二区不卡| 欧美激情一区二区三区在线 | 免费国产在线视频| 久久国产精品自由自在| 精品国产三级a∨在线观看| 午夜激情视频在线观看 | 国产麻豆精品高清在线播放| 天天做人人爱夜夜爽2020 | 中文字幕一区二区三区精彩视频| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 亚洲精品久久玖玖玖玖| 麻豆系列 在线视频| 成人免费一级纶理片| 国产亚洲精品成人a在线| 台湾毛片| 国产综合91天堂亚洲国产| 四虎影视久久久| 久久国产精品自线拍免费| 欧美激情伊人| 国产一区二区精品| 国产成人精品综合在线| 免费国产在线观看| 一级片片| 韩国毛片| 黄色福利| 天天做日日爱| 韩国毛片基地| 毛片高清| 国产高清在线精品一区二区| 台湾毛片| 久久精品大片| 99久久网站| 国产视频久久久久| 久草免费在线视频| 成人高清视频在线观看| 欧美一级视频高清片| 99久久精品费精品国产一区二区| 久久成人综合网| 国产91精品露脸国语对白| 精品国产一区二区三区久 | 黄色免费三级| 韩国三级香港三级日本三级| 免费一级生活片| 精品视频一区二区三区免费| 99久久视频| 午夜在线影院| 亚洲 激情| 精品视频在线观看视频免费视频| 国产91丝袜在线播放0| 久久精品人人做人人爽97| 香蕉视频久久| 色综合久久久久综合体桃花网| 九九九国产| 国产伦精品一区二区三区在线观看| 亚洲精品影院| 精品久久久久久影院免费| 日韩av东京社区男人的天堂| 国产麻豆精品hdvideoss| 成人影院久久久久久影院| 国产成人精品综合在线| 精品国产一区二区三区久久久蜜臀| 精品国产一区二区三区久 | 午夜在线影院| 国产一区二区高清视频| 国产成人啪精品| 日韩av片免费播放| 91麻豆精品国产高清在线| 四虎久久影院| 精品国产一区二区三区久 | 国产麻豆精品| 99久久视频| 精品久久久久久综合网| 日韩在线观看视频网站| 成人免费福利片在线观看| 成人免费福利片在线观看| 中文字幕一区二区三区 精品 | 精品国产一区二区三区久| 免费的黄色小视频| 国产麻豆精品视频| 精品久久久久久中文| 亚洲爆爽| 日本伦理片网站| 欧美1区| 麻豆系列 在线视频| 国产一区二区精品久久91| 日日日夜夜操| 麻豆系列 在线视频| 欧美激情一区二区三区在线 | 日本特黄特黄aaaaa大片| 国产一区二区精品尤物| 深夜做爰性大片中文| 欧美电影免费| 午夜激情视频在线观看 | 日韩av片免费播放| 成人免费网站视频ww| 日韩免费在线视频| 成人高清视频免费观看| 国产美女在线观看| 成人高清视频免费观看| 日本在线不卡视频| 日韩在线观看网站| 香蕉视频久久| 麻豆系列 在线视频| 国产91精品系列在线观看| 国产网站免费视频| 一 级 黄 中国色 片| 国产一区二区精品| 成人免费福利片在线观看| 国产网站免费观看| 一级毛片视频免费| 精品久久久久久中文| 青青青草视频在线观看| 日韩在线观看视频黄| 美国一区二区三区| 九九久久99综合一区二区| 国产亚洲精品aaa大片| 一级女性全黄生活片免费| a级毛片免费全部播放| 亚洲女人国产香蕉久久精品| 一级女人毛片人一女人| 午夜欧美成人久久久久久| 国产一级强片在线观看| 精品美女| 久久久成人网| 久久国产影院| 九九免费高清在线观看视频| 日本免费看视频| 午夜精品国产自在现线拍| 天堂网中文在线| 亚洲精品中文一区不卡| 国产精品1024永久免费视频| 国产综合91天堂亚洲国产| 欧美a免费| 天天色成人| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 亚洲女人国产香蕉久久精品| 青青久在线视频| 久久福利影视| 欧美激情一区二区三区视频| 亚洲第一页色| 香蕉视频久久| 成人免费观看网欧美片| 亚洲第一色在线| 欧美激情一区二区三区视频 | 91麻豆精品国产自产在线| 色综合久久手机在线| 成人高清护士在线播放| 亚洲第一色在线| 999久久久免费精品国产牛牛| 欧美日本免费| 可以免费看毛片的网站| 国产视频久久久| 国产精品自拍在线观看| 精品久久久久久中文字幕一区| 国产一级生活片| 韩国毛片免费| 欧美激情一区二区三区中文字幕| 青青久在线视频| 精品久久久久久综合网| 一级毛片看真人在线视频| 久久久久久久久综合影视网| 国产一区二区高清视频| 国产欧美精品午夜在线播放| 日本特黄特色aaa大片免费| 可以免费看污视频的网站| 免费国产在线观看不卡| 中文字幕一区二区三区 精品 | 成人av在线播放| 91麻豆tv| 久久成人亚洲| 日韩一级黄色片| 精品久久久久久综合网| 亚洲第一页乱| 亚洲精品久久久中文字| 亚久久伊人精品青青草原2020| 欧美激情一区二区三区视频 | 四虎影视库国产精品一区| 国产美女在线一区二区三区| 精品久久久久久影院免费| 亚洲第一色在线| 日韩综合| 午夜在线影院| 青青青草影院 | 麻豆污视频| 一本伊大人香蕉高清在线观看| 欧美激情中文字幕一区二区| 九九热国产视频| 成人免费一级纶理片| 国产伦久视频免费观看视频| 美女被草网站| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 午夜激情视频在线观看 | 国产91精品露脸国语对白| 九九免费高清在线观看视频| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 国产不卡高清在线观看视频| 成人免费福利片在线观看| 国产视频一区二区在线观看|