8月21日,深度求索(DeepSeek)公司在微信公眾號(hào)發(fā)文宣布,正式發(fā)布DeepSeek-V3.1。
當(dāng)前官方網(wǎng)頁端、App、小程序及API開放平臺(tái)所調(diào)用模型均已同步更新,新模型自我認(rèn)知為DeepSeek-V3。
深度求索介紹,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的參數(shù)精度。在評(píng)論區(qū),該賬號(hào)在置頂評(píng)論表示:“UE8M0 FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計(jì)。”
本次升級(jí)包含以下主要變化:混合推理架構(gòu):一個(gè)模型同時(shí)支持思考模式與非思考模式;更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短時(shí)間內(nèi)給出答案;更強(qiáng)的 Agent 能力:通過 Post-Training 優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。
官方 App 與網(wǎng)頁端模型已同步升級(jí)為 DeepSeek-V3.1。用戶可以通過“深度思考”按鈕,實(shí)現(xiàn)思考模式與非思考模式的自由切換。
本文鏈接:DeepSeek透露:針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計(jì)http://www.sq15.cn/show-3-152539-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇: 恒瑞醫(yī)藥上半年?duì)I收157.6億,國際化BD簽約金額超百億美元
下一篇: 瑞士制表業(yè)的困獸之斗