21世紀(jì)經(jīng)濟報道記者孔海麗、實習(xí)生劉清怡 北京報道
北京時間8月14日凌晨,谷歌在“Made by Google”大會上正式發(fā)布了智能語音助手Gemini Live。這一功能直接挑戰(zhàn)OpenAI的GPT-4o語音模式,并標(biāo)志著人工智能交互向更加自然、通用和用戶友好的方向又邁進了一步。
根據(jù)谷歌的介紹,用戶可以與Gemini Live進行自由流暢的對話,而不是通過傳統(tǒng)的輸入和輸出設(shè)置。
在對話過程中,用戶可以打斷以詢問更多細(xì)節(jié),或者暫停一段時間后再繼續(xù)。
為了使對話更加自然,谷歌還提供了十種聲音以供用戶選擇。谷歌稱,“這就像你的口袋里有一個伙伴,你可以和它談?wù)撔孪敕ɑ蚓毩?xí)重要的對話。”
Open AI此前發(fā)布的GPT-4o高級語音模式,也允許用戶在對話過程中打斷,并能感知和回應(yīng)用戶的情緒波動。在語音設(shè)置方面,Open AI提供了四種聲音,均與專業(yè)的配音演員合作制作。
此外,谷歌還將Gemini Live與其他應(yīng)用程序和工具連接。谷歌表示,將在未來幾周推出Keep、Tasks、Utilities、Calendar、YouTube Music等擴展功能。
谷歌描述了這些功能的具體應(yīng)用場景。比如用戶需要舉辦一場晚宴,可以讓Gemini Live找到特定的食譜,并把食材添加到Keep購物清單中,還能定制一份“讓人想起90年代末”的歌單;再比如只需要拍一張音樂會海報的照片,Gemini Live就可以回答用戶當(dāng)天是否有空,并提醒用戶買票。
不過,在“Made by Google”大會現(xiàn)場演示Gemini Live功能時,卻出現(xiàn)了一點小插曲。谷歌高管Dave Citron詢問Gemini Live他的日程表上有沒有活動,接連嘗試了兩次Gemini Live都沒有響應(yīng),直到第三次換了一個設(shè)備才演示成功。
目前,谷歌已向Android手機上的Gemini高級訂閱用戶提供英語版,并將在接下來的幾周內(nèi)擴展到iOS上,同時提供更多語言模式。谷歌發(fā)布的最新款Pixel 9系列手機也搭載了Gemini Live功能。
業(yè)內(nèi)人士認(rèn)為,Gemini Live的發(fā)布是人工智能交互發(fā)展的一個重要里程碑。通過引入語音中斷和選擇功能,谷歌既是在與OpenAI競爭,也是在推動人機交互的方式,從而改變?nèi)斯ぶ悄芰奶鞕C器人市場的競爭格局,倒逼其他公司創(chuàng)造出更多自然、實用、吸引人的人工智能助手。
同時,人機交互的創(chuàng)新發(fā)展也帶來了新的問題和挑戰(zhàn)。例如,人工智能將如何快速處理話題變化,同時保持上下文的統(tǒng)一和相關(guān)性?如何在不丟失重要線索的情況下處理干擾信息?更重要的是,隨著人工智能的深入發(fā)展,其與現(xiàn)實生活的邊界在哪里?
而OpenAI早在3個月前就已經(jīng)公開介紹過的GPT-4o,至今尚未完全落地。8月9日,OpenAI發(fā)布了一篇關(guān)于安全性的博客文章,詳細(xì)介紹了公司在開發(fā)GPT-4o時所做的安全努力,并探討了這些技術(shù)可能對社會帶來的風(fēng)險。
OpenAI在該報告中指出了人工智能的類人社交模式可能造成的風(fēng)險。OpenAI認(rèn)為,用戶可能會與人工智能建立社交關(guān)系,而減少對人類互動的需求。這有利于孤獨的個體,但會影響健康的人際關(guān)系。
OpenAI透露,在GPT-4o的早期測試時,他們觀察到用戶與模型的互動語言開始出現(xiàn)微妙的變化,例如,“這是我們在一起的最后一天”等等,這種看似無害的表達,背后可能隱藏著更大的問題。
此外,OpenAI還提到,GPT-4o有時會無意間生成模仿用戶聲音的輸出,這意味著,AI語音引擎可能會被用來欺詐。
而這些安全問題,也是OpenAI把控GPT-4o落地節(jié)奏的原因之一。至于谷歌Gemini Live是否解決了類似的安全隱患,并未披露。
所有與安全相關(guān)的隱患,無論是我們能夠意識到的,還是“潘多拉魔盒”附帶的更多可能性,都是人工智能事業(yè)需要進一步解決的問題,以保證“技術(shù)的進步是為了服務(wù)于人類”。
本文鏈接:谷歌“Her”搶跑落地 OpenAI語音AI仍在“hold on”http://www.sq15.cn/show-2-7981-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。