9月18日,華為全聯接大會2025在上海開幕。會上,浙江大學與華為技術有限公司聯合發布了國內首個基于昇騰千卡算力平臺的DeepSeek-R1-Safe基礎大模型。中國工程院院士陳純、華為昇騰計算業務總裁張迪煊等出席見證該模型的發布并發言。
發布儀式。華為 供圖
陳純對DeepSeek-R1-Safe基礎大模型發布表示祝賀。他指出,此次DeepSeek-R1-Safe的發布旨在打造安全可信的示范應用,推動大模型安全能力與產業生態協同發展。目前,浙江大學計算機科學與技術學院已組建起一支涵蓋多位海內外優秀青年人才的科研團隊,并已依托昇騰生態實現了自主全流程后訓練框架,完成了國內首次千卡集群大模型安全訓練,希望團隊未來與華為展開更深入合作,共同推動我國AI技術進步。
張迪煊表示,華為近年來持續加大研發投入,突破多項關鍵核心技術,在硬件與產業生態建設方面取得了一系列成果。在華為全聯接大會2025上,華為推出了昇騰新一代AI硬件與全系列軟件開源開放戰略,致力于通過深度開放協作,聯合高校與產業伙伴共同推動基礎軟件創新與AI安全能力建設。他相信,與浙江大學的緊密合作將有助于進一步增強源頭創新能力,共同筑牢安全、可信、有競爭力的AI產業生態。
浙江大學計算機科學與技術學院院長、區塊鏈與數據安全全國重點實驗室常務副主任任奎詳細介紹了DeepSeek-R1-Safe-671B基礎大模型的核心創新。他說,研發團隊從底層入手,構建了一套覆蓋“高質量安全語料—平衡優化的安全訓練—全鏈路自主創新軟硬件平臺”的全流程安全后訓練框架。在算力平臺搭建方面,團隊首次實現基于昇騰千卡算力平臺的千億級參數滿血版大模型安全訓練,系統性地解決了訓練環境中的關鍵問題,構建了服務器間環境依賴同步、數據與權重共享、協同訓練推理等一系列開發工具。
任奎稱,測試結果顯示,DeepSeek-R1-Safe針對有毒有害言論、政治敏感內容、違法行為教唆等14個維度的普通有害問題整體防御成功率近100%,針對情境假設、角色扮演、加密編碼等多個越獄模式整體防御成功率超過40%,其綜合安全防御能力達83%,在同樣測試設置下超過多個同期模型8%至15%。這些結果表明DeepSeek-R1-Safe不僅顯著提升了安全防護能力,也保障了模型的可用性,達成了安全能力與通用性能之間的有效平衡。
目前,模型已在ModelZoo、GitCode、GitHub、Gitee及ModelScope等多個社區全面開源。
本文鏈接:兼顧AI安全與性能,這款基礎大模型問世http://www.sq15.cn/show-11-26215-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 慶祝中華醫學會成立110周年大會在京舉行
下一篇: 十字花科作物根腫病防治獲突破