分享好友 最新动态首页 最新动态分类 切换频道
谷歌“狙击”OpenAI,发布新一代大模型!主打Agent+多模态
2024-12-27 23:07

继量子芯片之后,谷歌又来抢“OpenAI双12直播”的流量了!

谷歌“狙击”OpenAI,发布新一代大模型!主打Agent+多模态

就在刚刚,谷歌新一代大模型Gemini 2.0突然登场,再次由谷歌CEO皮猜亲自官宣。

新一代模型专为AI Agent而打造,谷歌表示目前已经将2.0版本提供给了一些开发者内测,正在迅速将其集成在Gemini和搜索等产品线中。

好消息是,Gemini 2.0 Flash实验版模型今天就在网页端开放,大家都能玩,移动端即将推出。

除此之外,谷歌还推出了一项名为深度研究(Deep Research)的新功能,基于高级推理和长上下文能力,它能直接帮你干研究助理的活儿——给个主题,自己出报告的那种。

目前这个新功能在Gemini Advanced版本中可用。

谷歌这一波出手,再结合Sora的不尽如人意,新一天的直播还没开始,已经有人开始唱衰OpenAI了:

OpenAI的护城河是什么?

“面向智能体时代的新AI模型”

在谷歌CEO皮猜、Google DeepMind CEO哈萨比斯,以及Google DeepMind CTO科雷(Koray Kavukcuoglu)三人共同撰写的博客文章中,官方给Gemini 2.0的定位是:

面向智能体时代的AI模型。

在多模态方面的新进展,以及原生工具的使用,使我们能够构建新的AI智能体,以更接近实现通用助手的愿景。

具体如何体现?在Gemini 2.0 Flash实验版第一时间上线的同时,谷歌还在Gemini Advanced中推出了一项名为深度研究(Deep Research)的智能体新功能。

你可以把它当成以研究助理,围绕一个复杂主题生成研究报告。有点像是个科研版AI搜索

另外一个Gemini 2.0的重点关键词是:多模态

2.0 Flash实验版除了支持图像、视频、音频多模态输入,还支持多模态输出。

不单单是简单的图文混排,可控的多语种文本到语音(TTS)输出也行,还能直接本地调用工具,比如谷歌搜索、代码工具、第三方用户定义的功能。

有ChatGPT插件那味儿了。

不过,作为实验模型,其文本到语音和原生图像生成功能目前仅提供给早期访问合作伙伴。谷歌透露2.0 Flash将在1月份正式推出,会提供更多不同大小的模型。

而根据谷歌发布的基准测试结果,不论是在多模态的图片、视频能力上,还是编码、数学等能力上,仅是Flash实验版的Gemini 2.0表现就已几乎全面超越Gemini 1.5 Pro 002。

而且它的速度是1.5 Pro的两倍。

谷歌表示,明年年初,会将Gemini 2.0扩展到更多旗下产品中,比如Project Astra。

就是I/O大会上谷歌推出来跟GPT-4o的语音功能打擂台的那个。

此次,基于Gemini 2.0,Project Astra更新了以下功能:

更好的对话:现在能够以多种语言和混合语言进行对话,更好地理解口音和不常见的单词。

使用新工具:Project Astra会用谷歌搜索、Lens和地图了。

更强的记忆力:Project Astra现在拥有10分钟的会话记忆,并且可以记住更多历史对话,也就说,凭借这些“记忆”,它能更懂你了。

改进延迟:Project Astra可以按正常人类对话的节奏来理解对话。

谷歌还提到,正在将Project Astra移植到眼镜等更多移动终端中。

另外,谷歌透露,他们正在和Supercell等游戏开发商合作,测试基于Gemini 2.0打造的游戏智能体们的实力。

这些智能体可以根据屏幕上的动作对游戏进行推理,并与玩家实时对话提供行动建议。

除了网页端可用,Gemini 2.0 Flash实验模型还通过Google AI Studio和Vertex AI的Gemini API向开发者提供。

从OpenAI跳槽到谷歌的Logan Kilpatrick表示,他们在Google AI Studio中创建了一个全新体验,展示了Gemini 2.0视频理解、原生工具使用、空间理解的入门应用。

那么,你觉得这够Agent吗?

参考链接:
[1]https://x.com/GoogleDeepMind/status/1866869343570608557
[2]https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ai-game-agents

最新文章
热门登山赛车破解游戏排行榜
介绍:登山赛车2破解版无限金币钻石采用了最真实的物理引擎,玩家可以在游戏中体验各种的赛车,体验在山顶、月球、草地的赛道驾驶,不断突破自己的极限成为赛车冠军!除此之外,登山赛车2破解内置菜单版经过破解,游戏内置了作弊菜单,可以
空间智能对AI发展为何如此重要?
  羊城晚报记者 陈晓楠  最近,在硅谷火爆数月的AI新概念“空间智能”有了最新进展:World Labs推出一个AI系统,仅凭1张图,就能生成一个可交互的3D游戏世界。用户能够像玩游戏一样,自由地移动,探索这个3D世界。  让人惊叹的是,
使用WordPress发送电子邮件的相关PHP函数用法解析
wp_mail() 函数用来发送邮件,类似于 PHP 的 mail() 函数。默认的发件人名称是 WordPress,发件人邮箱是类似 wordpress@example.com。用法参数$to(字符串 | 数组)(必须)收件人。多个收件人可以使用数组或者以逗号分隔邮箱的字符串。默
英国陆军开发新型高功率射频武器以反制无人机
2024年4月12日,据The Sun网站报道,英国陆军将测试一种高性能的“十一罗汉”式(Ocean’s Eleven)射频武器,该武器能够破坏敌方技术并使无人机失灵。这种使用无线电频率的武器是由位于威尔特郡索尔兹伯里波顿当的“伊林”项目研究实验室
广州开发区建区40周年科技人物 | 安利(中国)彭先武:以产品创新紧扣公众健康消费需求,用技术研发助力营养大健康产业高质量发展
“美好生活”战略的坚定推动者彭先武自从业以来,一直对我国营养大健康产业的发展十分关注。随着“健康中国”成为国家战略,以及近年公众的健康消费不断升级,营养大健康产业迎来巨大发展机遇。安利公司启动从“大健康”到“美好生活”的战
科技创新引领新生产力,经济增长新引擎加速来袭
2024年12月11日至12日,中央经济工作会议在北京举行,会议强调以科技创新引领新质生产力发展,为未来经济增长注入活力。这次会议明确指出,科技创新和产业创新的深度融合,将是中国经济高质量发展的新动力。专家对此表示,当前经济的持续增
怎么给视频做跳转链接 抖音跳转至微信
市场营销获客工具【爱短链】全域跳转工具,打通私域引流关键一步:轻松将公域流量,引导至私域,通过链接点击直达,方便快捷,无风险提示跳转,助力企业/商家高速获客》》点此生成链接
超逼真美女写真生成神器推荐:用AI工具轻松打造你的专属美丽
在这个数字化无处不在的时代,许多人希望通过科技来实现自己的美好愿景。泡泡们,你们是否也曾想象过用AI生成一张超真实的美女写真,却不知从何下手?今天,我们就来探讨如今市场上几款流行的AI美女写真生成工具,看看它们各自的特点和使用
知识问答下载智慧的钥匙知识的宝库
在这个信息爆炸的时代,我们每个人都面临着海量数据的冲击,每天都有无数的问题涌现。然而,解决这些问题并非易事,因为我们往往需要快速、准确地获取所需信息。这里就有了知识问答下载,它不仅是一个简单的搜索工具,更是我们智慧之门、知
相关文章
推荐文章
发表评论
0评