分享好友 最新动态首页 最新动态分类 切换频道
OpenAI大招要来了!AI语音助手狙击谷歌苹果,官宣下周二上新,GPT-5年前见
2024-12-26 12:43

作者 | 香草

编辑 | 李水青

智东西5月11日消息,今天凌晨,OpenAI宣布将于美国时间13日上午10点(北京时间14日凌晨1点)在官网直播,演示ChatGPT、GPT-4的更新内容。

据报道,OpenAI正在构建具备音频和视觉理解能力的AI语音助手,其中一些功能已经开始向客户展示,可能在下周的发布活动中预览。

知情人士消息透露,OpenAI可能会在今年内完成GPT-5的开发并公开发布。此外,OpenAI还计划推出一种新的定价模式,客户通过预付费预定Token,最高可以享受50%的折扣。

值得注意的是,其竞争对手谷歌的I/O开发者大会时间定在美国时间14日上午10点(北京时间15日凌晨1点),预计可能发布Gemini大模型的重要更新。OpenAI此次发布时间没有定在之前曝料的5月9日,而是“恰好”卡在I/O大会的前一天,火药味可谓浓厚。

要知道,这已经不是OpenAI第一次“卡点”狙击谷歌新品。今年2月,谷歌放出Gemini 1.5 Pro大招,结果没过几个小时,OpenAI就掏出文生视频“王炸”模型Sora,狠狠抢了Gemini 1.5 Pro的风头。

直播发布地址:http://openai.com

01.

AI语音助手仍存在“幻觉”问题

或将集成至ChatGPT免费版

OpenAI认为,具有视觉和音频功能的AI语音助手具有像智能手机一样的变革性潜力,理论上其可以做到一系列现在的AI助手无法做到的事,例如充当论文、数学问题指导老师,或是翻译交通标识、帮助解决汽车故障等。

但类似的技术目前所需硬件门槛太高,无法在个人设备上运行,用户可以在短期内使用基于云的版本来获取这些功能,例如自动化客户服务Agent。

OpenAI目前已经推出具备音频转录、文本转语音等功能的软件,不过这些功能是基于独立的对话AI模型实现,而新的语音助手则将这些功能整合在一起。据知情人士透露,该AI语音助手的音频功能能够帮助客服人员更好地理解对方的语气。

目前尚不清楚OpenAI何时向付费客户提供这些新功能,但据试用过该语音助手的人士透露,OpenAI最终的计划是将这些功能都纳入ChatGPT免费版本,目标是比目前其最先进模型GPT-4 Turbo的运行成本更低。该人士还谈道,AI语音助手在有些类型的问题上回答优于GPT-4 Turbo,但仍然存在幻觉问题。

对此,OpenAI发言人没有回应置评请求。

02.

与谷歌竞争iPhone合作位

GPT-5或于年底前发布

OpenAI推出AI语音助手主要目标是与谷歌竞争。

另一方面,提高模型的视觉、音频能力也有助于OpenAI与苹果达成合作。

最近几个月,苹果与OpenAI就下一代iPhone操作系统如何整合OpenAI的模型进行了讨论。然而,与此同时,苹果也与谷歌进行着类似的谈判。

这场竞争的最新消息是,据报道,苹果已接近与OpenAI达成协议,将在下一代iPhone操作系统iOS 18中使用ChatGPT;与谷歌尚未达成协议,但谈判仍在进行中。

除了可能在下周推出的AI语音助手外,OpenAI还一直致力于构建一款AI搜索引擎,旨在与谷歌竞争。此外,其也在开发一种被称作“计算机使用Agent”的自动化软件,用来辅助软件开发和其他计算机任务。

阿尔特曼还在与iPhone开发者乔尼·艾维(Jony Ive)合作开发一款独立的AI硬件。然而,最先进的AI模型体积庞大,需要在云端运行,并需要互联网连接才能工作。要使具有视觉和听觉功能的复杂AI模型变得足够小巧,以便在设备上运行,可能需要几个月甚至几年的时间。

不过,大家最关心的可能还是GPT-5。据报道,一位接近OpenAI领导人的人士称,其可能在今年年底完成GPT-5并公开发布。

OpenAI的新产品和AI模型开发工作进展得如火如荼,与此同时,其此前宣布的一些项目却变得不再那么受关注。尽管OpenAI曾向开发者承诺,会在今年第一季度推出GPT Store开发者激励计划,但目前仍没有实现。

03.

计划推出预付费定价模式

最高提供50%折扣

在定价方面,据知情人士透露,OpenAI计划推出一种新的定价模式,如果客户通过预付费预定Token,最高可以享受50%的折扣。

这样的优惠形式在云计算领域比较常见,微软Azure、谷歌云、亚马逊云服务(AWS)等都提供提前预定服务器容量折扣的方式来降低成本。

目前,按需定价提供API(应用程序接口)是OpenAI大模型的主要付费形式,通过每生成100万Tokens,向开发者收取几美分至一百多美分不等的费用,其中大客户可以享受批量折扣。

此前OpenAI已经提供了一种降低开发者成本的方式,其在4月推出Batch API,如果开发者批量上传模型查询,并接受等待最长24小时的时间,就可以获取更低的价格。

Together AI和Anyscale等AI服务器经销商曾表示,在他们的软件上运行开源模型要比使用OpenAI的模型便宜6倍。通过更灵活的定价,OpenAI与其他模型开发商的竞争将更具优势。据透露,其今年的营收可能达到数十亿美元。

04.

结语:OpenAI谷歌相争

苹果微软得利?

OpenAI与谷歌之间的竞争愈发激烈,二者之间的“商战”火药味也愈发浓厚。OpenAI又一次将新品发布时间定在了谷歌重大发布时间附近,似乎执着于抢夺谷歌风头这件事。

这一边,苹果同时与OpenAI、谷歌商谈模型集成至iPhone事宜,再次加剧了两家公司之间的竞争。虽然OpenAI被曝已与苹果达成合作,但谷歌那边的谈判也仍在继续。

而另一边,微软作为OpenAI最大的财务支持者,可以优先使用其先进技术来改进自己的语音助手。而微软也并非“孤注一掷”,除了积极自研模型外,还投资了OpenAI有力竞对Mistral AI,后者成为第二家在微软Azure云平台上提供商业AI模型的公司。

下周的OpenAI新品发布和谷歌I/O大会,或许会将这场“商战”推向新高度。究竟谁的“大招”会更厉害,我们拭目以待。

最新文章
GTC24 | China AI Day:探索 LLM 优秀实践和应用
GTC 2024 大会China AI Day线上专场,是 NVIDIA 为国内 AI 开发者、技术领袖和业务决策人举办的中文演讲系列,将于3 月 19 日上午 10:00举办。China AI Day 将以“大语言模型(LLM)”为主题,汇聚国内领先的云和互联网企业,和 NVIDIA 共
linkedin邮箱注册,,linkedin找客户邮箱电话
专业的海外APP账号购买平台,推特账号购买 , Facebook脸书账号购买 , INS账号购买,VK账号,VK账号购买,VK账号批发,出售instagram账号,ins账号,ins账号购买,ins粉丝加粉服务,国外ins小号自助购买批发平台,诚信经营海外APP账号批发出售。。推
ensp保存文件在哪_如何搞定文件管理?两招教你告别烦恼!
比如,做图片后期处理的同学,每天都要处理大量图片文件。第一种类型的人,处理完图片之后,就随便放在桌面或者某个文件夹里。第二种类型的人,会比较严谨一些,可能会把这些图片按照一定的顺序去摆放
ai题材活动策划文案范文:大全写作指南与范文精选
随着科技的飞速发展人工智能()逐渐成为我国乃至全球范围内的热门话题。各行各业都在探索怎样将技术与自身业务相结合以实现产业升级和创新发展。为了更好地推广知识增进公众对的认知度举办一场富有创意的题材活动显得为关键。本文将为您提
2024-2029年中国互联网理财行业发展状况与发展前景分析报告
权威数据来源一手调研资料调研方法直接观察法(实地走访、网络观察)访谈调查法(个别面访、集体面访、电话访谈、视频访谈、小组座谈)问券调查法(在线问券、电子邮件问券、入户分发等)会议调查法(参加博览会、展览会、高峰论坛、研修会
#生活小窍门#厨房收纳,怎么才能可以让厨房看起来井井有条呢?
#生活小窍门# 厨房收纳,怎么才能可以让厨房看起来井井有条呢?小编的爸爸是一名厨师,小时候家里开饭店,所以先天对吃的很感兴趣。工作后,因为和女朋友异地恋,所以空闲时间多点,就想找点事去做,充实下自己。就这样,慢慢学做饭,现在
7天涨粉6000 ,AI指令助你玩转公众号写作,轻松月入过万!
公众号运营难?内容创作苦?涨粉缓慢愁?
2024新奥精准资料免费大全078期|精选解释解析落实
本文目录导读:精选解释解析的重要性如何将精选解释解析落实于实际工作或生活中2024新奥精准资料免费大全078期:精选解释解析与落实策略在当前的信息化时代,各种资料、数据、信息层出不穷,如何从中筛选出有价值、精准的资料,成为了许多
Chrome插件 WEB 网页数据采集和爬虫程序_chrome插件爬虫开发(1)
一、Python所有方向的学习路线 Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。二、Python必备开发工具三、最新P
相关文章
推荐文章
发表评论
0评