新大模型可根據文本生成高清視頻

2024-04-28 08:55:33 來源：　科技日報

觀看：216

4月27日，在中關村論壇未來人工智能先鋒論壇上，清華大學聯合北京生數科技有限公司（以下簡稱“生數科技”）正式發布中國首個原創全自研視頻大模型——Vidu。論壇現場，清華大學教授、生數科技首席科學家朱軍向與會者展示了Vidu生成的視頻，包括行駛在崎嶇道路上的汽車、戴珍珠耳環的貓、彈吉他的熊貓等。與此前震撼業界的Sora一樣，Vidu能夠根據文本描述直接生成高質量視頻。

“長時長、高一致性、高動態性”是Vidu的顯著特征。朱軍表示，研發團隊的核心技術在于采用U-ViT架構。它由Diffusion與Transformer兩個模型融合而來，可支持一鍵生成長達16秒的高清視頻內容。

除了在時長方面優勢突出，Vidu在視頻效果方面也實現顯著提升。朱軍介紹，Vidu能模擬真實物理世界，生成的視頻不但場景細節復雜，而且符合物理規律，例如合理的光影效果、細膩的人物表情等。Vidu還具有豐富的想象力，能生成真實世界不存在的虛構畫面，創造出具有深度和復雜性的超現實主義內容。此外，Vidu可理解多鏡頭語言，生成的視頻不再局限于簡單的推、拉、移等固定鏡頭，而是圍繞同一主體實現遠景、中景、近景、特寫等不同鏡頭的切換，甚至能直接生成長鏡頭、追焦、轉場等效果，給視頻注入豐富的鏡頭表達。Vidu還獨具文化特色，能很好理解中國元素，生成熊貓、龍等中國元素的視頻。

值得一提的是，論壇上展示的視頻都是從頭到尾連續生成，沒有明顯的插幀現象。朱軍說，與Sora一樣，Vidu在文本到視頻的轉換過程中直接且連續，而且在底層算法上，是由單一模型完全端到端生成，不涉及插幀和其他多步驟處理。

本文鏈接：新大模型可根據文本生成高清視頻http://www.sq15.cn/show-2-5469-0.html

聲明：本網站為非營利性網站，本網頁內容由互聯網博主自發貢獻，不代表本站觀點，本站不承擔任何法律責任。天上不會到餡餅，請大家謹防詐騙！若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。

上一篇：華北地區首個高性能芯片測試平臺發布

下一篇： 68萬獎金角逐，2024華為軟件精英挑戰賽全球總決賽獲獎名單公布！

中文字幕亚洲欧美一区二区三区_亚洲精品菠萝久久久久久久_日本成人免费视频_狠狠躁少妇一区二区三区_国产精品中文字幕久久久_国产乱子伦农村叉叉叉_麻豆tv免费在线观看_av在线这里只有精品_色吧亚洲视频_嫩草影院一二三

新大模型可根據文本生成高清視頻

熱門資訊

推薦資訊

科技最熱文章