Lumiere 谷歌发布的文本到视频扩散模型

点击我跳转

图片[1]-Lumiere 谷歌发布的文本到视频扩散模型-小新

这个名为Google Lumiere的模型,是一个大规模视频扩散模型,彻底改变了AI视频的游戏规则。

跟其他模型不同,Lumiere凭借最先进的时空U-Net架构,在一次一致的通道中生成整个视频。

具体来说,现有AI生成视频的模型,大多是在生成的简短视频的基础上对其进行时间采样而完成任务。

而谷歌推出的新模型Google Lumiere是通过联合空间和“时间”下采样(downsampling)来实现生成,这样能显著增加生成视频的长度和生成的质量

论文地址:https://arxiv.org/abs/2401.12945

国内媒体介绍:谷歌爆肝7个月做出的AI视频生成器,彻底改变游戏规则?—新智元https://www.huxiu.com/article/2592137.html 

------本页内容已结束,喜欢请分享------

感谢您的来访,获取更多精彩文章请收藏本站。

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容