分享好友 最新动态首页 最新动态分类 切换频道
AI巨头竞逐数字宇宙构建技术
2024-12-26 19:50

2024年12月4日,技术界迎来了一项新的里程碑:发布了其名为Genie 2的AI系统,实现了从一张静态图片到一个可交互的3D世界的转变。虽交互时间短暂,但其中的细节精细度与交互流畅性都达到了前所未有的水平。

AI巨头竞逐数字宇宙构建技术

现行构建数字宇宙的主要技术路线包括:追求视觉真实的Sora、注重实时交互的Genie 2,以及专攻空间准确性的World Labs。这些路线都具有一定的优势和暂时无法解决的挑战。

未来目标将在这三条路线中实现技术融合,使AI生成的游戏和数字世界更加成熟,有许多问题仍待解决。

Genie 2具体效果引来了广泛关注:由画面清晰、细节丰富的技术迭代当中,可以看到从一张平面图片到一个3D立体世界的能力。该技术使用了DeepMind的先进图像生成模型Imagen 3,并配合自回归潜在扩散模型来实现。

Genie 2区别于其他技术的点在于:其引入的可控制智能体。为了实现这一控制,引入了无分类器引导技术,提高了动作的可控性,使其能准确识别场景中的可控制对象。

与场景互动能力得益于另一个项目的经验:SIMA项目通过在视频数据集上的训练,使得系统能够区分动态和静态元素,并理解交互规则。

Genie 2在渲染方面接近物理光学的效果:具备处理直接光照、全局光照以及材质反射的能力,并且实现了相对真实的动态阴影。

场景记忆机制让其保持高度的一致性:这对于连续场景的记忆和维持是至关重要的,反映出需解决的技术难点。Genie 2的生成能力虽然有很大进步,但同时也面临着鲜明的挑战,如训练数据限制导致的失误。

如增加场景物理规则的突然改变等现象仍有改善空间。总体而言,虽然Genie 2在生成质量和交互深度上实现了跨越,但在场景的长期叙事连贯性和一致性方面,存在待改进的地方。特别是生成持续时间的限制,目前Genie只有10-20秒的连续场景。

在AI世界模型构建方面,三家技术路线共逐:他们分别强调不同的特点,包括视觉真实性、交互自然性和空间准确性。

Sora通过时空扩散模型处理空间和时间信息:这样的处理既保持了画面的高质量,也保持了时间上的连贯性,但交互能力和准确性不足。

谷歌的Genie 2则在这方面作出了调整:通过自回归模型和游戏数据训练,强化了游戏引擎中的物理规则认知以及实时响应的能力。

World Labs则提供了空间几何精确性的解决方案:通过类似点云技术和几何重建的方法来保证三维结构的稳定性。

构建数字宇宙是一个长远的课题:每条技术都在努力解决视觉真实性、交互自然性和空间准确性的核心挑战。

未来的3A级游戏突破可能来自于这些技术的融合:结合Sora的视觉质量、Genie 2的交互能力以及World Labs的空间准确性的混合系统。

最新文章
适用于 Windows 和 Mac 的 9 种免费 PDF 转换器软件
人们会寻找 PDF 转换器软件,因为他们需要将任何 PDF 转换为可编辑的格式,例如 Word、Excel、PPT、图像或电子书。此外,这种应用程序对于将其他文档或照片转换为 PDF 非常有帮助,特别是让共享、所有人查看和归档
网页游戏源码,游戏源码网站,网页小游戏源码
实现养成类网页小游戏源码,支持定制开发和源码二次开发,并提供免费的售后服务。一、网页游戏源码的系统功能1、用户商店:网页游戏源码可以进入系统商店,查看动物品种,并进行购买。2、动物回收:游戏源码网站支持用户回收动物,并根据动
随州网站排名优化哪家好,深度剖析与推荐,随州的网站
随州网站排名优化,推荐选择专业的SEO优化公司。这些公司拥有丰富的经验和专业的技术团队,能够针对随州地区的特点,制定有效的优化策略,提升网站在搜索引擎中的排名。他们还提供定制化的服务,根据客户需求进行关键词研究、内容优化、链
零售店铺业绩提升方案需掌握的四点内容
  零售店是线下商铺的主要类型之一,各种类型的店铺都希望自己的门店业绩能够更好,但如果只依据潮流来进行经营,是不能维持长久发展的,有自己的店铺特色才能让更多用户记住你的店铺。今天就来讲讲零售店铺业绩提升方案需掌握的四点内容
网站漏洞检测工具,免费安全漏洞扫描工具
尽管我们在电子设备上安装了安全软件,但这些安全软件并不能自主跟踪并捕获所有漏洞。这时候,我们就需要额外安装网络漏洞扫描器,它可以帮助您自动执行安全审查,在IT安全中发挥重要作用。在扫描网络和网站时,网络漏洞扫描器能够查找成千
谷歌seo是什么的
在销售产品的过程中,获取流量是至关重要的一环。而谷歌搜索引擎优化(谷歌SEO)作为一种常见的推广方式,在独立站引流方面扮演着非常重要的角色。通过做好SEO运营,可以增加产品和品牌的曝光量,找到更多的潜在用户,提高用户对品牌的信任
百度生态蜘蛛池,探索搜索引擎优化与生态构建的新篇章,百度蜘蛛池搭建
百度生态蜘蛛池是探索搜索引擎优化与生态构建的新篇章,通过搭建百度蜘蛛池,可以吸引更多百度蜘蛛访问网站,提高网站权重和排名。该蜘蛛池采用先进的爬虫技术,能够模拟真实用户行为,提高爬虫效率,同时支持多种网站类型,包括企业官网、
高清美女写真生成指南:用AI打造你的数字女神!
DALL-E 2作为OpenAI推出的一款强大的图像生成工具,DALL-E 2能够根据用户的简短描述生成令人惊叹的图像。需要注意的是,虽然它的生成效果十分优秀,但在特定场景下可能不会完全符合用户的需求,尤其是精细化的个性特征。此外,DALL-E 2的使
TCL全领域全场景AI应用解决方案发布,包含这五项创新实践
凤凰网科技讯 12月11日,2024 TCL全球技术创新大会(TIC2024)在深圳举办。本次大会以“AI显见未来”为主题,聚焦AI应用、智能终端、半导体显示、新能源光伏等领域。TCL现场发布了“TCL全领域全场景AI应用解决方案”,包括AI智能操作、AI仿
手机续航是不是跟电池容量和功耗有关,电池容量越大、功耗越小、续航时间越长,他们三者之间有没有具体的公式关系?功耗一般在哪些地方耗电比较高?如何提高手机续航时间呢?
问题描述: 手机续航是不是跟电池容量和功耗有关,电池容量越大、功耗越小、续航时间越长,他们三者之间有没有具体的公式关系?功耗一般在哪些地方耗电比较高?如何提高手机续航时间呢? 问题解答
相关文章
推荐文章
发表评论
0评