分享好友 最新动态首页 最新动态分类 切换频道
Google全新发布AI视频Veo2、AI绘图Imagen3
2024-12-26 22:25

大半夜的,OpenAI的垃圾直播没任何看头,就发了个个性化的AI搜索。

但是,Google没有预告、没有营销,默默的在X上发了两个大货。

当今最先进的AI视频模型Veo 2,还有AI绘图模型Imagen 3改进版。

我们一群人,一边看效果,一边不断的惊呼卧槽。

我几乎从来不使用炸裂这个词,但是AI视频Veo 2的效果,真的让我有点想欢呼,甚至,有点像2月16号那个宿命的一夜,看Sora的感觉。

一个一个来说。

一. AI视频Veo 2

不说废话,先看视频。

说实话,这些视频,我都不愿意转成gif,而是直接传视频上来给大家看。

这个审美、这个稳定性、这个真实质感、这个物理规律,当得起当今最强的称号。

真的,物理之神,特别是那个切番茄的视频,我一度真的怀疑是实拍的,太恐怖了。

而且,我看了一圈Prompt,发现对拍摄风格、角度、运动等等的语义理解,都极佳。

比如这个汽车飞驰的视频,Prompt里写的就是:

低角度跟踪镜头,18mm 镜头。汽车漂移,留下光线和轮胎烟雾的轨迹,创造出视觉上引人注目且抽象的构图。相机低位跟踪,捕捉到流线型的橄榄绿色肌肉车驶向一个拐角。当汽车进行戏剧性的漂移时,镜头变得更加风格化。旋转的轮子和翻滚的轮胎烟雾,在周围城市灯光和镜头光晕的照射下,形成了在黑色沥青上划出的光线和色彩的条纹。城市景观--黄色出租车、霓虹灯和行人--变成了模糊的抽象背景。体积光照增加了深度和氛围,将场景转变为一个视觉上引人注目的运动、光线和城市能量的构图。”

有那么多的开车的AI视频镜头,而这,是我看过的最好的,没有之一。

还有,能直接对一个运动的物体,用Prompt来对其进行超级稳定的多轮材质变化。

稳定到起飞,这也是我第一次,能在AI视频里,见到如此稳定的特效变换的。

Google自己也做了一个人类观察者的评测,通过Meta发布的基准数据集 MovieGenBench,做了1003个数据,来让大家盲测,哪个效果更好。

最后得到的结果,是这样的。

这块我稍微解释一下,有两个表,分为Overall Preference(整体偏好度)和Prompt Adherence(提示匹配度)。

每个图表的横轴表示不同的被对比模型,分别是Meta、可灵v1.5、Minimax、Sora Turbo。

Google做的是把Veo 2跟这些模型做点对点的盲测。真的,国产模型居然也能作为对比基准了,突然有一股热血涌上心头。。。

而每个柱由三个部分组成,颜色代表结果分类:

绿色部分(Veo):评测者在对比中更偏好Veo输出的比例。

白色部分(Ties):评测者认为两者不分上下,即没有明显偏好的比例。

粉色部分(Other preferred):评测者更偏好另一模型(非Veo)的比例。

以Google DeepMind浓眉大眼的一贯作风,基本不会造假,所以能看到,Google的Veo 2在大多数情况下,取得了最优结果。

而在Google的评测里,除了Veo 2之外,另外四个模型里,最强的是可灵v1.5,这个结果也是挺有趣的。

而且,有一点是需要注意的,Veo 2,是可以直出4K视频的。

他们在Youtube上传的视频,也是原生4K,这个就非常的恐怖。

他们自己也说,目前最大的难点和限制,还是在运动上。

原话是:“创建真实、动态或复杂的视频,并在复杂场景或具有复杂运动的场景中保持完全一致性仍然是一项挑战。

来看一下他们的Badcase。

说是Badcase,但是我感觉他们发出来的时候估计脸上也都带着笑,那意思就是:

给你们看看,爷的运动有多强。

有瑕疵,但是对比Sora这种,这运动质量,已经吊炸天了。

Veo 2网址在此:https://labs.google/fx/tools/video-fx

需要排队,直接填一份表单就好。

按照Google的性格,排队肯定要不了多久,不是OpenAI那种纯粹耍猴的,绝不可能一等就是半年,应该很快就能用上。

OpenAI的这波12天直播,感觉彻底把路人缘败光了,之前Google一直被OpenAI恶心的头疼,而这次,直接彻底反击。

你喜欢狙我是吧,来来来,这次Gemini 2、Veo 2、Imagen 3我一个一个放,你不是喜欢抢热度吗?来啊,这次来抢啊,看谁抢谁啊小兔崽子。

老虎不发威,你还当我Google是病猫了?

二. AI绘图Imagen 3

除了Veo 2之外,Google这波还直接发了他们改进版的AI绘图Imagen 3模型,其实严格来说,是Imagen 3-002模型,Imagen 3的第二代。

第一代Imagen 3是2024年5月14日,在谷歌的I/O开发者大会上发的。

半年过去,Google对Imagen 3进行了一次大幅的进化,推出了改进版的第二代,他们自己的评测上,直接屠榜。

网址在此:https://labs.google/fx/zh/tools/image-fx

目前无需排队,可以直接玩,而且,免费。

直接在输入框里写Prompt,就可以开始玩。

他们这个Prompt的设计,也很有意思,你可以输入各种奇奇怪怪的一大串Prompt,他会自动给你拆解分词,有点像老罗当年那个胶囊大爆炸的感觉,把一些词分出来后,给你变成下拉框,自动联想几个其他的选项。

比如我的prompt是:

一个穿着巴斯光年服装的小黄人,身穿带翅膀的太空游侠套装,站在一个五彩缤纷的玩具店里,指着天空,仿佛准备起飞,背景是满满的玩具架,生动而富有活力的风格,中景。

一个非常简单的Prompt,我们翻译成英文后,扔到Imagen 3里。

你会发现它在运行之后,会给你选中一些词变成下拉。

比如它把wings单独拎了出来,你点下拉后。

可以自动替换成喷气背包、火箭助推器、滑板车等等,非常有意思。

我们按照它的联想,把背饰换成喷气背包、背景换成电子游戏机房、姿势改成挥手告别,再跑一张看看。

这个交互,真的很通人性。我太喜欢了。

再放一些我跑的图。

整体看下来,有一种感觉就是,下限贼低,很吃Prompt,要是Prompt写不好,那其实也会出不少很丑的图。

但是语义理解真的挺不错的,上限目前没太测出来,可能还不错。

但是不太适合新手玩。

写在最后

OpenAI这段时间的直播,彻底把人缘败干净了。

看了一圈,几乎都在骂。

不管是国内,还是国外。

再遥想今年2月16号,Google的Gemini1.5 Pro被OpenAI的Sora淹的彻底没了声量,而现在,整个局势,好像反了过来。

甚至,很多人都没发现,之前Sora的大功臣,都已经跳槽到Google DeepMind了。。。

营销这事,真的是一把双刃剑。

现在这OpenAI的局面,真的都是自己造的。

万物皆轮回。

不要把自己作没了。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

>/ 作者:卡兹克

>/ 投稿或爆料,请联系邮箱:wzglyay@gmail.com

最新文章
网络推广工具种类有哪些
网络推广工具种类繁多,可以根据推广目标和策略选择适合的工具。以下是一些常见的网络推广工具类别:1. 社交媒体管理工具: - 用于管理和优化社交媒体平台上的内容和广告。例如,Buffer、Hootsuite、Sprout Social。2. 搜索引擎优化工具(S
排列五开奖结果第2021327期 一等奖中出189注
  每天晚上20点30分,一起来和我关注体彩排列五开奖结果。今天是2021年12月07日,中国体育彩票排列三第2021327期开奖号码如下。排列五作为排列三的延伸,堪称排列三的老大哥,只有一个奖级设置,奖金高达10万元,故而深得彩民朋友的热爱
福建网站排名优化费用是如何计算的?
福建网站seo优化百度搜索引擎关键词快速排名推广提升自然流量点击SEO优化师、网站设计师、梦想者您的流量获取专家“创新互联”成立于2013年,是一家注重效果与用户体验的运营公司,创立至今为500多家企业提供了针对于网站的搜索引擎优化方
短网址生成器:提升链接分享与搜索引擎索引效率的利器
在日常生活和工作中,我们经常需要分享和传递链接,无论是在社交媒体上发布内容、发送电子邮件还是在广告宣传中,链接的长度往往是一个挑战,特别是对于一些复杂的、包含多个参数的链接来说。长长的链接不仅不美观,还可能被截断或错误地复
用AI绘画技术生成高清美女写真,轻松成为数字艺术大师!
在数字时代,生成艺术品的方式正在悄然改变。你是否曾梦想拥有自己理想的美女写真?而如今,借助人工智能技术,我们不仅可以实现这样的愿望,还能让生成过程变得轻松而有趣。那么,如何通过AI生成超逼真的美女写真呢?本文将带你探索这场科
震惊科技圈!他被发现死在家中,年仅26岁
点击上方蓝字,再点服务,点击听广播!今天(12月14日)北京时间12月14日旧金山首席法医办公室称曾在OpenAI工作近四年的前员工Suchir Balaji最近被发现死在他位于旧金山的公寓中旧金山首席法医办公室执行主任David Serrano Sewell周五已在
龙鞭保健酒加盟
           龙鞭保健酒智慧之选优势:(一)、多方面的综合市场调查:公司定期进行各种专业市场调研并把各种数据进行科学分析、汇总为您下一步运作市场提供更充分的参考依据。(二)、全程的市场策划:1、公司聘请着名营销策划为目标市
梦幻西游总共有多少种兽决
梦幻西游总共有多少种兽决?梦幻西游中获得兽决需要人物总经验达到一定的数量,目前游戏中共有多少种类呢,好像还有很多小伙伴还不清楚,接下来,小编就带大家来观看下吧。答:12种。须弥真言:主要是增加魔力*40%的法术伤害力,瞬法必备技
闲聊热播剧《叛逆者》中出现的时代元素:康可尔咖啡馆、罗便臣邮政局与德律风
热播剧《叛逆者》展示的故事背景是本世纪三四十年代的上海、香港与陪都重庆的风貌。在电视剧一开始,国民党特务林楠笙伪装成进步青年,想接近年轻的地下党朱怡祯,由于不知道对方的真实身份与真实目的,由童瑶扮演的朱怡祯和半真半假地喜欢
Python 爬虫从入门到进阶之路(四)
之前的文章我们做了一个简单的例子爬取了百度首页的 html,我们用到的是 urlopen 来打开请求,它是一个特殊的opener(也就是模块帮我们构建好的)。但是基本的 urlopen() 方法不支持代理、cookie等其他的HTTP/HTTPS高级功能,所以我们需要
相关文章
推荐文章
发表评论
0评