中國經濟導報、中國發展網記者 王曉濤
蓬勃發展的大模型時代將從“紅利呼之欲出”來到“紅利兌現時刻”。
11月6日,第八屆世界聲博會暨2025科大訊飛全球1024開發者節發布會上,科大訊飛以《更懂你的AI》為主題發布訊飛星火大模型最新技術升級及系列產品。
開場,科大訊飛董事長劉慶峰給出兩組數據。
訊飛聯合頭部企業深度打造的300+個“開箱即用”的重要崗位智能體:“星火行業分析師”是國內首個參加并通過工信部教考中心技術水平考試的行業分析AI應用;“星火招投標助手”在國家能源集團全年評審18萬單,評審準確率達97%。
2025年科大訊飛AI開發者大賽,17個國家的36898個團隊參加;4622個垂類智能體涌現,近一半團隊沒有技術背景。
劉慶峰指出,AI產業紅利兌現需聚焦于四個關鍵核心:自主可控、軟硬一體、行業縱深、個性化。
本次大會,深度推理大模型訊飛星火X1.5發布,在全國產算力平臺上攻克MoE模型全鏈路訓練效率,在模型參數小一倍的情況下對標國外領先水平,其多語言能力超130種,推動教育、醫療等行業大模型能力升級。
在自主可控的技術底座技術上,科大訊飛發布了融合AI+麥克風陣列、AI+揚聲器陣列等軟硬件一體的解決方案以及多模態交互能力,圍繞“更懂你的AI”發布或升級了教育、醫療、汽車、辦公等多個領域的AI新產品。
訊飛星火X1.5發布
在全國產算力平臺上攻克MoE模型全鏈路訓練效率
自主可控的“根技術”是實現“更懂你的AI”的基礎。
科大訊飛宣布以下兩大技術亮點:
在自主可控上,今年以來,科大訊飛再次攻克通用大模型國產算力訓練的兩座大山:一是攻克長思維鏈強化學習訓練效率,深度推理訓練效率從30%提升至84%以上;二是攻克MoE模型全鏈路訓練效率,實現大幅提升,再次夯實自主可控“壓艙石”。
在原創技術突破上,全球首發非自回歸語音大模型架構,實現推理效率大幅階躍。非自回歸語音大模型與傳統“自回歸”模型逐字順序生成文本不同,能夠并行、一次性輸出整個文本序列,效果相對提升16%,推理成本下降520%。該項新技術已應用在訊飛輸入法15.0版。
迄今為止,在國內通用大模型APP下載量排名前十以及大模型招投標市場份額前十的中國主流大模型中,訊飛星火仍是唯一基于全國產算力訓練的通用大模型。
劉慶峰強調:“在硬科技輸不起的人工智能時代,我們要給中國的國家戰略托底。”
訊飛星火X1.5發布。該模型采用MoE架構,推理效率相比訊飛星火X1提升100%。其語言理解、文本生成、知識問答、邏輯推理、數學能力、代碼能力等六大核心能力對標國際主流大模型,其中,數學能力持續保持國際領先。
在多個國內外重點任務評測集上,訊飛星火X1.5均展現出優秀實力。
因為有了更強的底座模型,深化行業思維鏈和數據飛輪,在教育、醫療等領域,星火行業模型優勢也進一步擴大。
多語言能力持續升級,可支持130+種語言,整體性能達到GPT-5(high)的95%以上,拉美、東盟等地區的14個重點語言效果領先;星火語音同傳大模型全新升級為2.0版本,在國際數據公司(IDC)發布的《中國AI翻譯技術評估》中,8大核心維度評測均為行業第一。
“今天,中國的AI開發者們只要用訊飛星火,出海再也不用擔心‘卡脖子’!”劉慶峰自豪地說。
AI+麥克風陣列、AI+揚聲器陣列等齊亮相
軟硬件一體解決方案發布
如何讓大模型從手機、電腦走向機器人、智能終端等更多的場景?
軟硬一體,是AI在真實世界應用落地的關鍵。
科大訊飛發布了軟硬一體的解決方案,在自主可控平臺基礎上,通過AI+麥克風陣列、AI+揚聲器陣列、AI+攝像頭陣列、AI+視覺呈現等方案,讓AI能聽會說、能看會認。
獨家“AI+麥克風陣列技術”,實現遠場高噪場景的識別和聲源定位,即使在嘈雜環境下,用戶也能用訊飛的產品實現精準錄音、識別和翻譯。
訊飛智能辦公本X5首創上4下4環麥克風大陣列,現場演示在高分貝環境中以及1米、3米、5米不同距離的識別和轉寫,其效果遠超競爭對手。
訊飛AI翻譯耳機首創單耳三麥多感融合降噪系統,采用“骨導+氣導”雙拾音降噪,在地鐵、展會的識別準確率高達97.1%。
訊飛雙屏翻譯機2.0實現1米以內穹頂式隔音降噪,帶著它去轟鳴的工廠、嘈雜的展會,都可以清晰收音、準確翻譯。
業界首個軟硬一體的同傳麥克風發布,放在會議桌上就能使用,能實現實時同傳翻譯字幕呈現,語音播報首響時延2秒以內,10種語言免切換自動翻譯;它的音頻文本數據都可以加密存儲,私有化部署更加安全。劉慶峰介紹,同傳麥克風已經在多個外商會談場景使用,得到政府領導、客商們的一致好評。
獨家“AI+揚聲器陣列技術”,用自研揚聲器硬件設計和獨家AI算法,實現立體空間聲場重構和均衡,讓每臺車都能擁有百萬級豪車的視聽盛宴,讓教室的每個角落都能聽清。
用于智能座艙聲場的iFLYSOUND,目前已在19家車企量產落地,出貨超100萬臺。此前,科大訊飛聯合奇瑞打造了風云A9L的“伯牙之音”AI音響,獲得業內、用戶一致認可,專業人士評價“西方有柏林之聲,東方有伯牙之音”。“我們打破了過去30年車內音響組件依賴進口的情況,實現百分百全國產化,歐洲的頂尖品牌現在也想要‘伯牙之音’。”劉慶峰話語中透著喜悅。
在教室場景,訊飛AI黑板擁有24通道AI揚聲器陣列,每個孩子都能聽清老師的講課。
在視覺效果上,訊飛的AI產品也在不斷突破。訊飛AI黑板搭載全球首款圓偏類自然光護眼大屏,模擬自然光影,130度超寬域顯示,再也不用擔心孩子看不到黑板。科大訊飛AI學習機,集微納米類紙屏、全波段圓偏振光、硬件級低藍光、DC調光無頻閃、AI環境光檢測算法、坐姿AI算法等技術為一體,獲得國內外10多項權威護眼認證。
除此之外,訊飛還創新了獨家AI+攝像頭陣列技術,實現目標精準識別和跟隨。
云臺攝像頭、學習機攝像頭、車外攝像頭陣列……加上領先AI算法,讓軟硬件一體的多模態交互走向現實。
定義多模態交互8項能力
首發個性化記憶能力和百變聲音復刻
軟硬一體支撐的多模態交互是AI融入真實世界的物理基礎。
搭載多模態交互綜合能力的數字人導覽“小飛”來到現場,能夠實現多人對話,和不同的對話人自然順暢交流,有問有答;還能用多種語言和不同國籍的嘉賓交流,一鍵買票、訂酒店;并記住來訪嘉賓的歷史信息,貼心提醒:“你前兩天有點感冒,開車沒問題吧?”。更有趣的是,她還能秒變“虛擬人林黛玉”,用各種各樣的形象為客戶服務。“小飛”已在訊飛公司展廳和今年的科博展上崗。
真正的多模態交互需要哪些能力?劉慶峰表示:要能進行麥克風遠場識別、3D視覺感知、多人主動交互、類人舉止反饋、視聽覺融合理解、超擬人數字人、個性化記憶、情感語義。“有了這些技術的綜合聯動,我們的AI就不再是一個簡單的APP軟件,而是可以走入我們更有情感、更有深度應用的各個空間中。”
發布會上,星火X1.5首發個性化記憶能力,實現多源記憶庫信息檢索、應用,以及個性化記憶識別、提取和更新,構建了用戶個性化記憶庫,包含長期畫像、近期反饋、短期對話和個人資料數據。
首發百變聲音復刻,基于星火語音大模型底座,一條指令創造任意風格,一句錄音復刻任意音色,二者間可實現解耦和任意組合,實現百變聲音復刻的效果。在演示環節,科大訊飛研究院院長劉聰現場展示了強大的語音合成技術:不僅能一鍵生成“溫暖女生”“霸氣將軍”等不同風格的角色聲音,還用華為常務董事、終端公司董事長余承東的公開采訪,直接復刻出其音色來演繹“霸氣將軍”與“神奇法師”等截然不同的角色,更讓“余承東”流利說出阿拉伯語、英語等內容,3分鐘演示贏得3次掌聲。
劉慶峰表示:“超擬人多模態交互,將是未來AI進入每個家庭的標配。”
“更懂你的AI”
滿足人類工作、生活、成長、情感等多種需求
什么是更懂你的AI?
它應該理解人類工作、生活、溝通、成長等不同維度的需求:在追求效率與成就的工作領域,懂邏輯與任務;在人類追求安全與穩定的生活領域,懂健康與習慣;在人類追求關系與理解的情感領域,要懂語言與共情;在人類追求進步、自我實現的成長領域,要懂潛能與積累。
一個“更懂你的AI”,需要有歷史記憶、人格特征、多維理解等能力和專有知識。
它更懂你的學習和成長。在教育領域,科大訊飛跨過“更懂孩子學情”的三個臺階:業界領先的整題評分持續升級,分步驟批改首次達到實用水平,并首創錯因體系、精準分析,獲得國家義務教育數學課程標準修訂組組長曹一鳴教授領銜專家組的權威鑒定。
在軟件上,三級錯因體系能分析出3大類、3層級、4000+錯因標簽;在硬件上,通過星火智能批閱機實現分步驟批改、錯因診斷,通過星火教師助手推送復習策略并及時調整課件,通過訊飛AI黑板實現基于學情的精準教學。“這能實現從作業精細批改到課堂因材施教的小時級閉環,引領教學范式變革。”劉慶峰說。
一個好的老師,不僅要洞悉教育規律、有效落地教學流程,也要親切、積極、陽光、有同理心、善于鼓勵,用這些特質感染孩子,讓孩子真正愛上學習。
發布會現場,“更懂你的AI老師曉悅”亮相,用類人的形象和聲音、匹配教學的肢體動作以及激勵性的語言和肯定的語氣來陪伴孩子學習和成長。她將應用在訊飛教育的相關產品中。
它更懂你的身體與健康。醫學診斷能力過硬,可以幫助醫生輔診;在健康檔案和管理方面,不僅知道你的基本信息和情況變化,還能做好診前咨詢、診后跟蹤。
目前已覆蓋了801個區縣的智醫助理此次進一步升級,面向等級醫院發布智醫助理醫院版1.0,提供輔助診療、輔助會診、病歷生成與病歷質控等四大核心功能。新增醫學思維鏈循證推理和中醫輔助診療,覆蓋病種數和首診合理度都實現提升。星火醫療大模型在門診場景診療能力、住院場景診療能力上實現關鍵突破,“專科AI能力在業界首次達到等級醫院主任級醫師水平”。多地醫院的試點顯示,人機協同可以提升專科診斷、跨科室診斷的合理率,減少病歷書寫時間。
現場,劉聰展示了智醫助理的升級特性,系統能根據患者的癥狀,自動推薦可能的診斷,還會提示醫生接下來該從哪些方向進一步排查,新增的“臨床思維鏈”可結合患者的關鍵信息,依托訊飛星火醫療大模型和最新的權威醫學知識,將不同診斷背后的證據和推理過程展示出來,幫助醫生更全面診斷。
面向C端用戶,個人AI健康助手“訊飛曉醫”全新升級:支持解析99%醫學報告,形成更完整的個人健康檔案;用170種細分標簽維度,構建更全面的個人健康畫像;140余種專業疾病管理路徑支撐,提供更專業的健康管理服務。目前,訊飛曉醫APP已累計完成1.6億次AI健康咨詢,用戶滿意度達98%。
它更懂你的生活和習慣。會上,科大訊飛發布“懂你”“懂車”“懂環境”的星火智能座艙2.0。
它懂“車外環境”,讓你能“看見”周圍,再也不用擔心“下車踩水坑”的情況了;
懂“車內操控”,2000多個車輛原子化能力均可控制,停車繳費,一鍵無感支付;
懂“車內情景”,場景識別,服務匹配度高達95%,有人未上車,及時提醒;
懂“你的歷史”,54維2808個記憶錨點,“好車識途”,記得你愛走的路,記得你愛聽的歌,也記得你愛的人的生日;
懂“你的健康”,5項體征實時監測,眼睛干澀疲勞自動提醒,一鍵買藥送到家;
懂“你的意圖”,說話識別正確率超過95%,每個指令都能精準完成。
汽車真正成為融生活、工作、娛樂于一體的“第三空間”。
它更懂你的工作與創造,了解你的崗位、風格、資料、同事,成為專屬智能工作伙伴,越用越好用。
劉聰在現場用訊飛智能辦公本X5錄音、手寫記錄劉慶峰的演講。基于說話人識別的能力,它自動整理文檔內容,并生成會議紀要和待辦事項,加入日程。“它不僅是一個工具,還能成為我的助理。”劉聰現場展現了手寫紀要和AI紀要的深度整合功能,手寫的會議要點會在最后生成的紀要中強化展現,更貼合用戶的記錄需求,并且所有的紀要內容可精準回溯至原始錄音,核對更高效。
在軟件端,訊飛智能辦公本X5的AI會議紀要功能,都將在訊飛聽見上線,成為每個人的辦公搭子。“真正懂你的AI辦公工具,就應該是便捷好用的,而不需要你額外花時間去學習或準備——這是我們想帶給你的體驗。”劉慶峰表示。
它更懂你的內心與情感,讓每個人都能擁有一個積極、忠實的“AI朋友”。
發布會的最后有一個溫暖的“彩蛋”。科大訊飛正式發布AI陪伴“星朋友”,它被定義為一位懂你的“成長伙伴”,而非冰冷的工具,擁有高保真聲音和超過160種人設模型定制,并通過自學習情感模型記憶偏好,在用戶需要時會主動打電話,失眠時陪伴安慰,低落時加油打氣,面試前提醒輔導。它是一個高度定制的情感容器,更能引導用戶積極行動。
目前,“AI星朋友”周均使用9.8次,正向情緒反饋率達82%。科幻電影《Her》正在成為現實,微信搜索“AI星朋友”小程序即可體驗。
劉慶峰再次強調,“唯有生態繁榮,才有人工智能的大未來”。
在自主可控的底座上,星火開發者生態正在蓬勃發展。發布會上,2025科大訊飛AI開發者大賽十佳團隊揭曉。近一年來,訊飛開放平臺的開發者數新增超200萬,達968萬,其中,智能硬件開發者增長102%,大模型企業開發者增長125%,智能體開發者成為新的增長動力,近半數來自非技術領域。
面向開發者,科大訊飛打造首個原生支持RPA的智能體平臺Astron:Agent(智能體)+RPA(機器人流程自動化),將“大腦”和“手腳”結合,跨越AI應用鴻溝;八大行業競品智能體“開箱即用”,行業場景能快速應用落地。目前已全面開源,為中國開發者打造自主可控的全球創新引擎。
會上,科大訊飛啟動“星火點亮全球”計劃啟動,將與全球伙伴在技術、產業、教育等領域展開深度合作,共建開放、繁榮的全球AI新生態。
AI不僅是硬科技的競爭賽道,更應當是賦能每個人更好融入世界、共創溫暖未來的力量。
當專業能力日新月異的大模型一次次超越個體,人類更應站在AI的肩膀上,避免社會內卷、避免同質化,讓每個人獨特的閃光點得以綻放。
“讓更懂你的AI成就更好的你,不僅是科大訊飛的初心,更是我們堅定的使命。我們期待與所有用戶、開發者一起,在技術演進中成為更好的自己,共同開創更有價值的產業未來。”劉慶峰說。
本文鏈接:讓更懂你的AI成就更好的你http://www.sq15.cn/show-5-76719-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。