近日,美團宣布LongCat-Flash-Chat正式發(fā)布,在Github、Hugging Face 平臺開源。LongCat-Flash采用創(chuàng)新性混合專家模型(MoE)架構,總參數560B,激活參數18.6B-31.3B,實現了計算效率與性能的雙重優(yōu)化。
據相關負責人介紹,LongCat-Flash在層間鋪設跨層通道,使MoE的通信和計算能很大程度上并行,極大提高了訓練和推理效率。配合定制化的底層優(yōu)化,LongCat-Flash在30天內完成高效訓練,并在H800上實現單用戶100+tokens/s的推理速度。針對智能體能力,LongCat-Flash自建了Agentic評測集指導數據策略,并在訓練全流程進行了全面的優(yōu)化,包括使用多智能體方法生成多樣化高質量的軌跡數據等,實現了優(yōu)異的智能體能力。
此外,通過系統優(yōu)化,LongCat-Flash在H800上達成了100token/s的生成速度,在保持極致生成速度的同時,輸出成本低至5元/百萬token。
今年以來,美團AI進展頻傳,發(fā)布了AI Coding Agent工具NoCode、AI經營決策助手袋鼠參謀等。公司負責人表示,美團AI戰(zhàn)略會建立在三個層面:AI at work、AI in products以及Building LLM,此次模型開源是其Building LLM進展的首度曝光。
本文鏈接:LongCat-Flash-Chat發(fā)布并開源http://www.sq15.cn/show-11-25630-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 第二屆等離子球磨技術與應用研討會舉辦