10月最后一周,人工智能“獨(dú)角獸”上海稀宇極智科技有限公司(即MiniMax)掀起了一場(chǎng)AI技術(shù)的“全家桶”發(fā)布熱潮。繼開(kāi)源文本大模型M2之后,MiniMax接連發(fā)布視頻模型Hailuo 2.3、語(yǔ)音模型Speech 2.6和音樂(lè)模型Music 2.0。
10月27日,MiniMax新一代文本大模型MiniMax-M2宣布發(fā)布和開(kāi)源,這款僅有10B激活參數(shù)(總參230B)的輕量級(jí)模型在全球權(quán)威測(cè)評(píng)榜單Artificial Analysis (AA)上總分沖入全球前五、開(kāi)源第一,躋身文本模型第一梯隊(duì)。
在模型定價(jià)方面,該模型“高智能,更實(shí)惠”,綜合成本低至約0.53美元/百萬(wàn)Tokens,不及Claude 4.5 Sonnet的8%,推理速度是其近兩倍。MiniMax相關(guān)負(fù)責(zé)人介紹說(shuō),M2專為編碼與智能體任務(wù)深度優(yōu)化,非常契合新興多智能體工作流對(duì)高效協(xié)同與快速響應(yīng)的需求。
10月28日,MiniMax最新視頻生成模型海螺2.3(Hailuo 2.3)正式發(fā)布。據(jù)介紹,這款在Hailuo 02模型基礎(chǔ)上實(shí)現(xiàn)全面技術(shù)升級(jí)的新版本,在動(dòng)態(tài)表現(xiàn)力、風(fēng)格化呈現(xiàn)以及人物表演細(xì)膩度方面取得了顯著突破。其技術(shù)亮點(diǎn)主要提現(xiàn)在強(qiáng)大的動(dòng)態(tài)表現(xiàn)力、風(fēng)格化創(chuàng)作能力的顯著提升、人物表演的自然度大幅提升3個(gè)方面。
在成本控制方面,海螺2.3在提升性能表現(xiàn)的同時(shí)保持了Hailuo 02的原有定價(jià)水平,實(shí)現(xiàn)了”加量不加價(jià)”。同時(shí)推出的海螺2.3 Fast版本,在保證畫質(zhì)和表現(xiàn)力的基礎(chǔ)上大幅提升了生成速度,并采用了更低的定價(jià)策略。
MiniMax發(fā)布的Speech 2.6模型專門針對(duì)Voice Agent場(chǎng)景進(jìn)行了深度優(yōu)化,將首包響應(yīng)時(shí)間壓縮到250毫秒。除此之外,該模型新增的Fluent Lora功能能夠?qū)⒖目陌桶偷脑间浺魪?fù)刻成流暢自然的聲音。
MiniMax發(fā)布的音樂(lè)生成模型Music 2.0在人聲表現(xiàn)方面實(shí)現(xiàn)了新的突破,音色無(wú)限接近真實(shí)人聲,能夠駕馭多種唱法和情感風(fēng)格,支持男女對(duì)唱、阿卡貝拉等風(fēng)格。模型還支持對(duì)人聲音色的精準(zhǔn)控制,可以在保持核心音色的基礎(chǔ)上,讓同一聲音切換不同唱法,實(shí)現(xiàn)”一聲千變”。此外,在器樂(lè)控制方面,Music 2.0能夠生成包含主歌、副歌、橋段等邏輯清晰、結(jié)構(gòu)完整的歌曲,單首時(shí)長(zhǎng)可達(dá)5分鐘。
“AI技術(shù)正在改變?cè)絹?lái)越多人的工作和創(chuàng)作方式,我們希望成為創(chuàng)作者的全能助手和創(chuàng)新先鋒,讓每一個(gè)靈感都能超越形式的限制。”前述負(fù)責(zé)人表示。
本文鏈接:MiniMax發(fā)布全模態(tài)模型“全家桶”http://www.sq15.cn/show-11-27698-0.html
聲明:本網(wǎng)站為非營(yíng)利性網(wǎng)站,本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。