分享好友 最新动态首页 最新动态分类 切换频道
AI视频边生成边播放!首帧延迟仅1.3秒,生成速度9.4帧/秒
2024-12-26 20:30

AI生成视频,边生成边实时播放,再不用等了!

AI视频边生成边播放!首帧延迟仅1.3秒,生成速度9.4帧/秒

Adobe与MIT联手推出自回归实时视频生成技术——CausVid

思路就像从下载整部电影到直接观看流媒体的转变,在模型生成首帧画面后,视频便可以即时播放,后续内容则动态生成并无缝衔接。

如果你用过视频生成模型,一定对漫长的等待时间记忆深刻,生成一段10秒的视频,往往需要等待好几分钟才可以开始观看。

研究团队表示,这一延迟的根本原因在于:传统视频生成模型普遍采用的双向注意力机制,每一帧都需要参考前后帧的信息。

这就像写故事时必须先构思好整个剧情的所有细节才能动笔,在完整视频生成完毕前,你看不到任何画面。

为此,他们提出了一种全新的解决方案,通过蒸馏预训练的双向扩散模型(DiT)构建自回归生成模型

实验中,CausVid基于自回归生成的特性,无需额外训练就能支持多种应用,生成速度和质量均显著超越现有方法。

研究团队还表示将很快开源基于开源模型的实现代码。

用双向教师监督单向自回归学生模型

如前所述,研究团队通过蒸馏预训练的双向扩散模型(DiT),构建自回归生成模型。

为了进一步提速实现实时视频生成,作者通过分布匹配蒸馏(DMD)将生成步骤从50步缩减到仅需4步。

DMD是一种扩散模型蒸馏技术,将多步扩散模型转换为快速的单步生成器。DMD此前已在图像生成中取得成功,Adobe Firefly文生图的快速模式就是基于此技术。

本次研究团队将其创新性地应用到视频扩散模型中,实现了显著加速。

然而,自回归模型有一个核心难题——误差累积

每一帧视频都基于之前的帧生成,早期生成的任何细微缺陷都会被放大,导致生成的视频逐渐偏离预期轨迹。

为了解决这一问题,团队提出了非对称蒸馏策略。具体来说:

引入一个拥有未来信息的双向教师模型,在蒸馏训练阶段指导自回归的单向学生模型。这种教师-学生结构允许模型在生成未来帧时具备更强的精确度。

使用双向教师模型生成的的噪声-数据配对来预训练单向学生模型,提升其后蒸馏训练过程的稳定性。

在训练过程中,针对不同时间点的视频帧施加不同强度的噪声,这一策略使模型能够在测试时基于干净的已生成帧对当前帧进行去噪。

通过这种创新性的非对称蒸馏方法,CausVid显著减少了自回归模型的误差累积问题,并生成了更高质量的视频内容。

这种非对称蒸馏形式中,学生模型和教师模型使用了不同的架构,而这只有在DMD风格的蒸馏中才可行。其他方法,例如渐进式蒸馏(Progressive Distillation)或一致性模型(Consistency Distillation),都要求学生模型和教师模型使用相同的架构。

下面是自回归扩散视频模型的误差累积示例(左图)和CausVid结果(右图)对比:

实验效果如何?

实验中,CausVid表现惊艳:

首帧生成延迟从3.5分钟降至1.3秒,提速170倍

生成速度从0.6帧/秒提升至9.4帧/秒,提升16倍

生成质量经VBench和用户调查验证,优于主流模型例如Meta的MovieGen和智谱的CogVideoX

得益于单向注意力机制,CausVid完全支持在大语言模型中广泛应用的KV缓存推理技术,从而显著提升了生成效率。结合滑动窗口机制,CausVid突破了传统模型的长度限制。

尽管训练阶段仅接触过10秒的视频,CausVid依然能够生成长达30秒甚至更长的视频,其生成速度和质量均显著超越现有方法。

基于自回归生成的特性,CausVid无需额外训练就能支持多种应用:

图片动画化:将静态图片自然转化为流畅视频,赋予画面生命力。

实时视频风格转换:如将Minecraft游戏画面即时转换为真实场景。这一技术为游戏渲染带来全新思路:未来可能只需渲染基础3D几何信息,由AI实时补充纹理和光影

交互式剧情生成:用户通过调整提示词,实时引导视频剧情发展,带来全新的创作体验。

项目链接:https://causvid.github.io/

最新文章
全球微资讯!新车报讯:设计感强做工精致宝马3系GT现金优惠高达6.15万
生活中,很多人都不知道千元手机排行榜2014前十名_千元手机排行榜2014前十名,其实非常简单,下面就是小编搜索到的千元手机排行榜2014前十名_千元手机排行榜2014前十名相关的一些知识,我们一起来学习下吧!2016年的热门手机是苹果、三星、
视频号小店官方旗舰店商品上架有哪些策略?哪些商品更受用户欢迎?
在视频号小店开设官方旗舰店,商品上架的策略和用户喜好的把握对于商家来说至关重要。这里,我们聊聊如何让你的店铺商品更吸引人,以及哪些类型的商品更容易赢得用户的心。### 上架策略,这样做就对了- **资质先行**:在视频号小店上架商品
集群介绍,keepalived介绍,使用keepalived配置高可用集群
18.1 集群介绍集群或者说是群集:其目的是为了实现将多台计算机组合以来完成特定的任务,比如天气预报,大型网络游戏,这些都需要很大的运算量,单台计算机实现成本太高,而且不现实。那么就需要通过集群的方式,将闲置的或者正在使用的计
php设置Apache虚拟主机vhost
本文地址:http://blog.csdn.net/oneym/article/details/48050487 作者:oneym一、环境描述1、使用php环境使用XAMPP 2、win7_64位系统 3、XAMPP安装在C盘根目录二、修改相关文件1、在系统中注册主机头使用文本编辑工具编辑C:WindowsSystem3
如何进行wap SEO
Wap SEO和web SEO其实有着很多相通的地方,了解web SEO对学习wap SEO是有很大帮助的。那么如何进行wap页面的SEO呢?做SEO的人都知道“内容为王,外链为皇”,下面环球视野主要从wap页面的内部本身以及外链等几个方面介绍一下wap页面的SEO技
百度推广怎么做关键词优化,效果更好?
在互联网营销这片浩瀚的海洋中,百度推广无疑是众多企业扬帆起航的重要平台。作为一名在数字营销领域摸爬滚打多年的实践者,我深知关键词优化对于百度推广效果的重要性。今天,我将结合过往的实战经验,与大家分享如何精准地优化关键词,让
山东SEO优化,助力企业网络竞争力全面升级
山东SEO优化推荐,为我国企业提供专业网络营销策略,助力企业优化搜索引擎排名,提升品牌知名度和市场竞争力。全方位服务,精准定位,助您在激烈的市场竞争中脱颖而出。随着互联网的快速发展,越来越多的企业开始重视网络营销,而SEO优化作
SEO网站培训,掌握搜索引擎优化方法,提升网站排名
随着互联网的普及,越来越多的企业开始关注网络营销,而SEO(搜索引擎优化)作为网络营销的重要组成部分,越来越受到重视。为了帮助企业更好地掌握SEO培训,本文将详细介绍SEO的基本概念、策略和技巧,助力企业提升网站排名。一、SEO基本概
什么是网站SEO优化,它包括哪些主要的步骤和策略?
随着网络的普及和互联网的逐渐成为人们获取信息、购物等活动的主要渠道,之间的竞争也越来越激烈,这时,优化网站就显得尤为重要。那么,什么是网站SEO优化?它包括哪些主要的步骤和策略呢?下面我们就来详细探讨一下。1.什么是网站SEO优化
WordPress插件开发:教你怎么开发WordPress插件
代码中的8是当前函数被执行的顺序(默认为10)。该参数指定的更小的数字会被更早的执行在某些情况下,你会发现你希望你的插件屏蔽WordPress内建或者其他插件加入的Action或Filter。举例来说,remove_action(‘publish_post’,
相关文章
推荐文章
发表评论
0评