可用文本生成視頻虛擬與現(xiàn)實已分不清？Sora將帶來什么

2024-02-21 09:13:23 來源：

觀看：1105

　　OpenAI首個視頻生成模型發(fā)布

　　可用文本生成視頻虛擬與現(xiàn)實已分不清？Sora將帶來什么

　　在2月16日，OpenAI宣布推出全新的生成式人工智能模型“Sora”。據(jù)了解，通過文本指令，Sora可以直接輸出長達60秒的視頻，并且包含高度細致的背景、復(fù)雜的多角度鏡頭，以及富有情感的多個角色。

　　這意味著，繼文本、圖像之后，OpenAI將其先進的AI技術(shù)拓展到了視頻領(lǐng)域。OpenAI亦表示，Sora是能夠理解和模擬現(xiàn)實世界的模型的基礎(chǔ)，這一能力將是實現(xiàn)AGI(通用人工智能)的重要里程碑。

　　對于OpenAI視頻生成模型的出現(xiàn)，業(yè)內(nèi)其實早有預(yù)期，但仍有人評價稱“比想象中來得更快”，亦有人振奮地表示“我們真的看到新工業(yè)革命來臨”。

　　2月16日，業(yè)內(nèi)分析人士對記者表示，Sora無疑是人工智能領(lǐng)域的一次重大突破，該技術(shù)不僅展示了AI在理解和創(chuàng)造復(fù)雜視覺內(nèi)容方面的先進能力，而且對內(nèi)容創(chuàng)作、娛樂和影視制作行業(yè)帶來了前所未有的挑戰(zhàn)和機遇。

　　Sora視頻的長度和質(zhì)量

　　超出了迄今為止所見的水平

　　“一名時尚女子走在充滿霓虹燈和廣告牌的標志性東京街頭，她穿著黑色皮夾克、紅長裙和黑靴子，拎著黑色手袋，戴著太陽鏡，涂著紅色口紅，走路自信又隨意。街道潮濕且反光，在燈光映射下形成鏡面效果，行人走來走去?！边@段60秒的視頻，并非真實拍攝，而是OpenAI最新的“文生視頻”模型Sora，這一段文字描述就是段Prompt(提示詞)。

　　當?shù)貢r間2月15日，人工智能(AI)巨頭OpenAI宣布，正在研發(fā)“文生視頻”模型Sora，可以創(chuàng)建長達60秒的視頻，其中包含高度詳細的場景、復(fù)雜的攝像機運動以及充滿活力的情感的多個角色，也可以根據(jù)靜態(tài)圖像制作動畫。OpenAI稱，目前紅隊成員(red teamers)可以使用Sora來評估關(guān)鍵的危害或風(fēng)險，還向一些視覺藝術(shù)家、設(shè)計師和電影制作人提供訪問權(quán)限，以獲取有關(guān)如何改進該模型以對創(chuàng)意專業(yè)人士最有幫助的反饋。

　　Sora視頻一出，立刻震驚業(yè)界。盡管這不是首個AI視頻，其他企業(yè)也有類似文本生成視頻的AI模型，谷歌正在測試名為Lumiere的模型，Meta則有名為Emu的模型，還有人工智能初創(chuàng)企業(yè)Runway也在開發(fā)相應(yīng)產(chǎn)品來幫助制作視頻，但外媒指出，人工智能專家和分析師表示，Sora視頻的長度和質(zhì)量超出了迄今為止所見的水平。

　　美國伊利諾伊大學(xué)香檳分校信息科學(xué)教授Ted Underwood指出，沒想到在兩三年內(nèi)還會有如此持續(xù)連貫水平的視頻生成技術(shù)，OpenAI的視頻可能展現(xiàn)了該模型的最佳性能。

　　多名AI從業(yè)者稱，從Sora公布的預(yù)覽視頻來看，簡直太“瘋狂”。在國外Reditt社區(qū)，有個網(wǎng)友提問，今天OpenAI公布的Sora模型是否會成為自動化對于經(jīng)濟影響的里程碑？下面有將近100條回復(fù)，有網(wǎng)友稱，起初ChatGPT的發(fā)布讓用戶看到了一切皆有可能，而現(xiàn)在人工智能正在不斷進步發(fā)展，讓用戶看到了強大的技術(shù)能力。

　　有海外網(wǎng)友評論稱，Sora的出現(xiàn)是一項改變世界的產(chǎn)品，但同時也指出，Sora生成的視頻或許讓人工智能專家也難以分辨真假，這或許是個棘手的問題。

　　內(nèi)容創(chuàng)作領(lǐng)域開啟新紀元

　　確保內(nèi)容真實透明成重要問題

　　2021年初和2022年末，OpenAI分別推出了圖像生成系統(tǒng)DALL?E和聊天機器人ChatGPT。這也使得AI逐漸成為各行各業(yè)輔助工作的工具，也正逐漸改變?nèi)藗儗ξ磥砉ぷ鞯目捶?。?jù)介紹，Sora是基于過去對DALL?E和GPT的研究基礎(chǔ)構(gòu)建，利用DALL?E 3的重述提示詞技術(shù)，為視覺模型訓(xùn)練數(shù)據(jù)生成高描述性的標注，因此模型能更好的遵循文本指令。

　　Sora能夠生成具有多個角色、特定類型的運動以及主題和背景的準確細節(jié)的復(fù)雜場景。不僅了解用戶在提示中要求的內(nèi)容，還了解這些東西在物理世界中的存在方式。同時，該模型對語言有深刻的理解，使其能夠準確地解釋提示并生成表達生動情感的引人注目的角色。

　　對于Sora的面世，工信部信息通信經(jīng)濟專家委員會委員、數(shù)字經(jīng)濟專家劉興亮稱，這標志著AI技術(shù)在內(nèi)容創(chuàng)作領(lǐng)域的一個新紀元?！凹夹g(shù)創(chuàng)新的這一巨大飛躍，預(yù)示著AI在未來人類生活的各個方面都將發(fā)揮更加重要的作用?！眲⑴d亮表示。

　　而Sora以文字為核心的提示，將能夠形成更加符合人類觀念的連續(xù)視頻，該模型的出現(xiàn)無疑將會對人們現(xiàn)有工作方式進行再一次迭代，同時也會對傳統(tǒng)行業(yè)轉(zhuǎn)型提出新的挑戰(zhàn)。

　　生成式AI過去已積累了不少圖像、聲音等素材，并通過不斷學(xué)習(xí)形成了更為成熟的算法。因此，若是可以通過AI在計算機中創(chuàng)建視頻素材，或許將對影視行業(yè)產(chǎn)生重大影響。

　　劉興亮稱，AI生成的視頻可能減少了對人類演員、導(dǎo)演和其他創(chuàng)意角色的需求，從而影響到這個行業(yè)的就業(yè)。此外，隨著AI技術(shù)的進步，傳統(tǒng)的影視制作流程和商業(yè)模式也可能面臨重塑。

　　不過，劉興亮指出，這種轉(zhuǎn)型并不意味著傳統(tǒng)影視行業(yè)的消亡，而是需要與AI技術(shù)融合，探索新的藝術(shù)形式和表達方式。

　　劉興亮同時提到，隨著AI生成內(nèi)容與現(xiàn)實之間的界限變得越來越模糊，如何確保內(nèi)容的真實性和透明性成為了一個重要問題。此外，版權(quán)、隱私和數(shù)據(jù)安全等問題也需要得到妥善解決。社會必須面對這些挑戰(zhàn)，通過制定相關(guān)政策、法律和倫理準則來確保技術(shù)的健康發(fā)展，同時保護個人和社會的利益不受侵害。

　　拉大產(chǎn)業(yè)競爭差距

　　AI生成視頻技術(shù)或?qū)⑦M入爆發(fā)期

　　對于Sora當前存在的弱點，OpenAI指出它可能難以準確模擬復(fù)雜場景的物理原理，并且可能無法理解因果關(guān)系。該模型還可能混淆提示的空間細節(jié)，例如混淆左右，并且可能難以精確描述隨著時間推移發(fā)生的事件，例如遵循特定的相機軌跡。

　　以此次發(fā)布的DEMO“與中國龍一起慶祝農(nóng)歷新年的視頻”為例，Sora無法準確生成視頻畫面中的中文受到了網(wǎng)友的關(guān)注。有相關(guān)人士對此調(diào)侃道：“莫非是中文太難了？”

　　但是任何事件的發(fā)生都是從無到有，再從有到精的過程。據(jù)悉，Sora如今正面向部分用戶開放，以評估關(guān)鍵領(lǐng)域的潛在危害或風(fēng)險。同時，OpenAI也邀請了一批視覺藝術(shù)家、設(shè)計師和電影制作人加入，期望獲得寶貴反饋，以推動模型進步，更好地助力創(chuàng)意工作者。OpenAI提前分享研究進展，旨在與OpenAI以外的人士合作并獲取反饋，讓公眾了解即將到來的AI技術(shù)新篇章。

　　OpenAI表示，他們正在教AI理解和模擬運動中的物理世界，目標是訓(xùn)練模型來幫助人們解決需要現(xiàn)實世界交互的問題。

　　而相比于其自身缺陷，該技術(shù)的廣泛前景更為外界所關(guān)注。

　　近兩年，由于人工智能發(fā)展迅速，以至于很多企業(yè)紛紛加大了對人工智能的投入?？萍紕?chuàng)業(yè)公司研究機構(gòu)PitchBook估計，2023年全球生成式AI的市場規(guī)模將達426億美元，2026年則將達到981億美元，未來增長動能可期。

　　隨著生成式人工智能的市場潛力不斷地被挖掘，大大小小的競爭對手開始浮出水面。

　　當前，參與該賽道的企業(yè)不乏亞馬遜、微軟、谷歌、百度、阿里等眾多互聯(lián)網(wǎng)巨頭，也包括Runway等初創(chuàng)企業(yè)。

　　有行業(yè)人士指出，隨著Sora的發(fā)布，OpenAI在行業(yè)的領(lǐng)先程度立即加大，會將大家緊追的距離再度拉開一大截。未來，解決了人物一致性問題之后，AI生成視頻將大踏步前進，AI視頻或進入大爆發(fā)期。

　　綜合澎湃新聞、每日經(jīng)濟新聞

　　來源：成都商報

本文鏈接：可用文本生成視頻虛擬與現(xiàn)實已分不清？Sora將帶來什么http://www.sq15.cn/show-5-6843-0.html

聲明：本網(wǎng)站為非營利性網(wǎng)站，本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻，不代表本站觀點，本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅，請大家謹防詐騙！若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。

上一篇： 27億元票房領(lǐng)跑春節(jié)檔憑什么《熱辣滾燙》？

下一篇：天津重點監(jiān)測商貿(mào)企業(yè)春節(jié)假期銷售額同比增11.2%

中文字幕亚洲欧美一区二区三区_亚洲精品菠萝久久久久久久_日本成人免费视频_狠狠躁少妇一区二区三区_国产精品中文字幕久久久_国产乱子伦农村叉叉叉_麻豆tv免费在线观看_av在线这里只有精品_色吧亚洲视频_嫩草影院一二三

可用文本生成視頻虛擬與現(xiàn)實已分不清？Sora將帶來什么

熱門資訊

推薦資訊

社會最熱文章

中文字幕亚洲欧美一区二区三区_亚洲精品菠萝久久久久久久_日本成人免费视频_狠狠躁少妇一区二区三区_国产精品中文字幕久久久_国产乱子伦农村叉叉叉_麻豆tv免费在线观看_av在线这里只有精品_色吧亚洲视频_嫩草影院一二三

可用文本生成視頻 虛擬與現(xiàn)實已分不清？Sora將帶來什么

熱門資訊

推薦資訊

社會最熱文章

可用文本生成視頻虛擬與現(xiàn)實已分不清？Sora將帶來什么