首页 > 实用技巧 > 干货教程 > AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!

AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!

发布时间:2024-06-19 22:58:06

Runway前脚刚发布Gen-3 Alpha,Google后脚就跟了个王炸。

 

北京时间6月18日凌晨,Google Deepmind发布了视频生成音频(Video-to-Audio,V2A)技术的进展,可以为视频创建戏剧性的背景音乐逼真的音效,甚至是人物之间的对话

 

V2A技术支持为AI生成视频“配乐”,Google还特别强调了官网发布的Demo视频都是由自家在五月份发布的生成视频模型“Veo”和V2A技术合作打造

 

有不少网友表示,这下终于可以给用Luma生成的meme视频配上声音了!

 

从Google Deepmind官网发布的Blog上看,V2A技术会采用视频像素文本提示来生成与底层视频同步的音频波形。

 

首先,V2A会对视频和文本提示进行编码,并通过扩散模型迭代运行,将随机噪声细化为与视频和所提供的文本提示相匹配的真实音频,最后再对音频进行解码并与视频数据相结合。

 

X网友纷纷表示太赞了,但就是有一个小小小小的问题,和同样是凌晨发布的Runway的视频生成模型Gen-3 Alpha一样,这

又是一个大家都用不上的超赞模型,到底啥时候开源让咱们试试水!

干货教程更多>>

大众集团启动欧洲范围数据驱动道路安全计划 极氪8X外观设计官方解读:一体式直瀑格栅 保时捷多款纯电车型接入特斯拉超充网络 一汽红旗全固态电池首台样车成功下线 一场岛屿争端,为何让欧洲车企股价集体雪崩? 特斯拉与沃尔沃汽车将成为中加电动汽车协议首批赢家 启境汽车发布第三期网友问答,线下服务网络规划明确 纯电下滑30%!2025俄罗斯车市大洗牌 华为上半年的大招!麒麟9030+直屏+3D面容识别,Pura90放手一搏 后库克时代谁主苹果? “硬件掌门”约翰·特努斯呼声最高 不讲武德,什么电摩敢卖几十万? 月销87870台,同比下滑32.4%,上汽大众2025年12月销量出炉 全域AI 2.0助力,吉利今年将带来全新智舱、智驾体验 魏牌12899台,哈弗66453台,长城汽车2025年12月销量出炉 2025年12月的新势力销量成绩单,藏着未来的生死局 新能源电驱领军企业未来3年采购额预计破30 亿,寻源泛欧供应商! 启境汽车官宣11月20日发布 SU7部分车型交付提速,小米汽车有何考量? 小米汽车公布车辆“相对超速”提示专利 2025年1-9月智能座舱供应商装机量排行榜:技术迭代加速,头部优势凸显 进厂打工!优必选工业人形机器人WalkerS2开启量产交付 新一代奔驰GLB内饰官图发布 12月8日亮相 法雷奥温岭新厂房即将投产 华为乾崑All in新品牌\"启境\",首款车型2026年年中上市 换装第五代2.0T发动机!中期改款揽巡发布 华为加持!广汽丰田铂智7亮相 东京车展沦为“地方庙会”?全球车市仍看日本脸色 锂电池出口管制暂停实施;马斯克或将离开特斯拉 华域汽车前三季度净赚46.9亿元;保隆科技与威孚高科合资公司开业 最低购车价6.48万 2026款起亚奕跑上市