分享好友 最新动态首页 最新动态分类 切换频道
谷歌深夜炸场发布Gemini 2.0 2025属于智能体之年?
2024-12-27 17:29

  AI大厂的竞争日趋白热化,一边OpenAI正如火如荼进行着为期12天的产品发布活动,另一边谷歌也在频频放大招。

  目前谷歌完全对外开放的新模型是Gemini 2.0 Flash体验版,这是谷歌的主力模型,具有低延迟特性。与此前的1.5 Flash版本相比,Gemini 2.0 Flash 在同样快速的响应时间下性能进一步增强。谷歌提到,2.0 Flash 在关键基准测试中甚至超越了此前的旗舰模型 1.5 Pro,其速度是 1.5 Pro 的两倍。

  同时2.0Flash 还具有新功能,除了能够支持图片、视频和音频等多模态输入,2.0 Flash可以支持多模态输出,例如可以直接生成图像与文本混合的内容,以及原生生成可控的多语言文本转语音(TTS)音频。它还可以原生调用 Google Search、代码执行以及第三方用户定义的函数等工具。

  作为提供给开发者的体验版模型,Gemini 2.0 Flash 现在可以通过 Google AI Studio 和 Vertex AI 中的 Gemini API 获取,所有开发者均可使用多模态输入和文本输出。该产品将于 1 月全面上市,谷歌称届时将推出更多型号。

  对于Gemini 2.0模型,谷歌表示会先将开放给开发者以及受信任的测试人员,并将其整合到产品中。Gemini 2.0基于谷歌定制的硬件第六代 TPU Trillium 构建而成。谷歌表示,TPU 为 Gemini 2.0 的训练和推理提供 100% 算力支持。

  模型之外,谷歌这次的重头戏是智能体。在发布产品的同时,谷歌CEO桑达尔·皮查伊(Sundar Pichai)在X上着重提到了智能体Project Astra,认为其“展示了通用 AI 助手的曙光”。

  皮查伊表示,“2025 年将是令人兴奋的一年。”帖子下则有评论表示,2025 年会是属于智能体的一年。

  谷歌增强了 Project Astra 的记忆能力,这一助手目前可以记住长达 10 分钟的会话内容,并且可以回忆起过去与它进行的更多对话,能提供个性化服务。

  在此前5月I/O大会上的演示中,在询问Project Astra时,其语音回复还有一定的延迟,谷歌这次改进了这一点,博客提及,借助新的流式处理技术和原生音频理解能力,该智能体能够以接近于人类对话的延迟来理解语言。

  “AI智能体在现实中的应用是一个令人振奋且充满可能性的研究领域。”谷歌称,团队正在探索这个全新的领域,并开发出了一系列原型,帮助人们完成任务。除了Project Astra的升级版,这次谷歌发布的智能体还包括:完成复杂任务的智能体 Project Mariner,能够帮助开发者的编码智能体Jules,以及和其他领域的智能体。

  Project Mariner是使用Gemini 2.0 构建的早期研究原型,可以从浏览器开始探索人机交互,它能够理解和推理浏览器页面中的信息,包括像素和文本、代码、图像和表单等网页元素,然后通过Chrome 扩展程序使用这些信息为用户完成任务。

  在 WebVoyager 基准测试中,Project Mariner 作为单个智能体设置实现了 83.5% 的工作效率,达到了先进的水平。但谷歌提到, Project Mariner目前的运行并非总是准确,且完成任务的速度较慢,仍处于早期阶段。

  值得一提的是,临近2024年底,AI智能体频频被行业人士提及。所谓智能体,简单来说是能够感知环境,具有独立思考和行动能力的AI程序。传统AI通常是指令驱动的,需要人类用户输入指令才会执行相应的任务,AI智能体则有独立解决任务的能力。

  近日发布研究报告称,海外大厂积极布局智能体构建应用,AI智能体正在快速发展,智能体在C端硬件落地正进入临界点。

  10月21日连发10个AI智能体,面向销售、运营等场景,11月19日又宣布Copilot Studio平台已支持用户构建自主智能体,同时发布5款预构建的智能体。12月,公布了一系列布局AI大模型的进展。

  在国内,以智谱为代表的厂商也开始重点发力AI智能体。10月25日,智谱发布AutoGLM智能体,可通过读取语音指令理解用户意图,并模拟人类行为,自动完成点外卖、订机票和酒店等操作。11月29日,智谱推出AutoGLM智能体升级版,支持自主执行超过50步的长步骤任务,并且能够在执行任务时灵活切换不同的APP。

  除智谱以外,字节、、腾讯、阿里等科技大厂也开始布局智能体,包括字节的Coze Agent平台、千帆AgentBuilder智能体开发工具等。

  在此前的采访中,瑞银中国科技软件分析师张维璇预测,“明年是Agent(智能体)的大年。”她表示,最近也看到美国领先的软件厂商发布了AI 智能体的产品,通过智能体将企业的工作流自动化,在前中后台的很多应用都能看到对客户的效率和用户体验的提高,并且这些软件公司也获得了提价。

最新文章
小程序租赁系统开发助力便捷高效的租赁体验与服务转型
在如今这个快节奏的生活中,小程序租赁系统开发如同一场及时雨,为租赁行业带来了新的发展机遇和转型契机。想象一下,用户在指尖轻轻一点,就能浏览到成百上千种租赁产品,从自行车到相机,甚至是舞台
Python——网络爬虫,一个简单的通用代码框架
一、代码"""通用代码框架:可使网页爬取变得更稳定更有效下面是一个爬取百度网页的例子,正常情况下是返回"""import requestsdef get_HTML_Text():try:r = requests.get(url, timeout=30)r.raise_for_status()# 若状态不是200,引发HTTPErr
病毒性眼结膜炎和细菌性眼结膜炎的区别是什么
病毒性眼结膜炎和细菌性眼结膜炎的区别在于病原体类型、传染性、症状发展速度、治疗方式以及预后情况。1.病原体类型病毒性眼结膜炎是由病毒感染引起的,而细菌性眼结膜炎则由特定细菌感染所致。前者具有自限性,后者需要抗生素治疗。2.传染
百度霸屏技术-SEO关键词排名技术之一
网络上风传百度霸屏技术,小白可能会认为是一项非常高深的技术,长时间沉迷在寻找百度霸屏原理上,无形之间也浪费了很多小白的时间,今天新成讲诉一下百度霸屏技术的原理,如何才能做到百度霸屏。 一、什么是百度霸屏技术,它有什么好处?
泉州抖音SEO优化推广专家助力企业乘风破浪,抢占短营销高地
泉州抖音SEO优化推广公司,专业提供抖音平台SEO优化与推广服务,帮助企业精准定位目标受众,提升品牌影响力,抢占短营销风口,助力企业实现快速增长。随着短行业的迅猛发展,抖音已经成为企业营销不可或缺的重要平台,面对如何在抖音上获得
男生女生向前冲第16季之1米八女老师来闯关 男大一骑绝尘成功登顶高能片段
{{if !data.isVip && data.isActText}}{{else if !data.isVip && !data.isActText}}{{else}}{{if !data.isNormalVip}}{{if data.expiredVip && data.isActText}}{{else if data.expiredVip && !data.isActText}}{{else}}{{/if}}{{else if d
wordpress 插件新页面/迈步者seo
点击查看全文 阿里巴巴18周年年会已圆满落幕。十八岁,意味着成人,意味着更大的担当和责任。上次在这个帖子里:史上最盛大的黑科技年会前夕,阿里妹做了一个重大决定 阿里妹发了一个问题:“18岁的时候
高清美女写真生成新突破:用AI工具创造你的虚拟女友
在这个科技快速发展的时代,AI技术已经渗透到我们生活的方方面面,尤其是在艺术创作领域。你是否曾想象过,利用AI工具生成一张超逼真的美女写真,或许这位虚拟美女正是你欣赏艺术的化身?今天,我们将深入探索几款在美女写真生成领域备受瞩
神马搜索移动适配指南(神马搜索客户端)
1. 基本功能供站长提交pc->wap对应关系,神马搜索根据对应关系将收录的PC页替换为wap页2. 适用范围网站兼有PC版和Wap版3. 移动适配方式A. 自主适配B. 标注META声明C. 提交页面对应关系3.1 自主适配1)含义站长自己做好PC和wap网页的自适配
粤Z年检代办指引及要求
粤港车牌申请条件个人申请:1任期内担任县(市、区)级以上人大代表及政协委员2曾向内地善心捐款500万以上的海外华人华侨港澳台同胞注:个人车牌无法转让,企业车牌可以进行转让企业申请:1FV车牌(大陆→香港)一、在我省办理核准的国有企
相关文章
推荐文章
发表评论
0评