8月4日,騰訊混元宣布開源四款小尺寸模型,參數分別為 0.5B、1.8B、4B、7B,消費級顯卡即可運行,適用于筆記本電腦、手機、智能座艙、智能家居等低功耗場景,且支持垂直領域低成本微調。
相關模型參數 騰訊官方
目前,四個模型均在Github和Huggingface等開源社區上線,Arm、高通、Intel、聯發科技等多個消費級終端芯片平臺也都宣布支持部署。
據官方發布的內容,在實測中,四個新模型在語言理解、數學、推理等領域,得分都達到領先水平。
模型相關得分 騰訊官方
據悉,相關模型也兼容SGLang、vLLM、TensorRT-LLM等主流推理框架。
據介紹,這四款 “小” 模型具備雙腦協作能力,反應靈活。一個 “快腦” 能瞬間響應信息,快速解決如 “推薦附近川菜館” 等簡單問題;一個 “慢腦” 擅長深思熟慮,可處理 “設計自動寫周報系統” 等復雜任務,如同24小時在線的最佳拍檔。
同時,模型擁有超強記憶,能精準應答。它可一次性處理256K上下文,即便經過幾十輪項目方案討論,也能記住每處細節,后續提問時依舊對答如流。
模型的Agent能力也相當突出。它能深度搜索資料、整理去年消費賬單并自動生成Excel分析,還能一手包辦旅行規劃從路線搜索到攻略制定的全流程,高效處理多種任務。
本文系觀察者網獨家稿件,未經授權,不得轉載。
本文鏈接:手機端也能流暢運行,騰訊混元宣布開源四款小尺寸模型http://www.sq15.cn/show-3-151234-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。