分享好友 最新动态首页 最新动态分类 切换频道
ChatGPT能让Siri和小爱同学变聪明吗?
2024-12-25 18:09

AI 语音助手的「蠢」,好像全世界都知道。

不管是 Siri 还是小爱同学,大部分使用过所谓「AI 语音助手」的用户大概都同意,它们肯定不算聪明。尤其是在 ChatGPT 出来之后,这种对比尤为明显,甚至包括微软的最高话事人也在批评自家的语音助手。

微软 CEO 萨蒂亚·纳德拉最近在接受英国《金融时报》采访时表示,苹果的 Siri、亚马逊的 Alexa,微软自家的 Cortana(中文名:小娜)以及公认拔尖的 Google Assistant,这些语音助手有一个算一个:

都笨得跟石头一样。

纳德拉和 Cortana,图/微软

2014 年 4 月,纳德拉刚刚上任微软 CEO 两个月后的微软 Build 开发者大会上,微软全球副总裁乔北峰正式推出了 Cortana。在最初的几年,Cortana 表现了不俗的智能,也受到包括纳德拉在内微软高层的集体认可,纳德拉在 2016 年还称赞 Cortana 的智能,并说「机器人是新应用」。但 Cortana 的智能(横向比较)和市场份额越来越糟糕,到 2021 年微软就正式宣布停止支持 iOS 和 Android 上的 Cortana 应用,仅保留对 Windows 平台的支持。

更重要的是,OpenAI 带着 ChatGPT 来了,微软直接拿到了 AI 时代目前为止最好的一张船票。与此同时,语音助手在过去几年基本陷入了停滞,Siri 的联合创始人 Adam Cheyer 也承认,ChatGPT 理解复杂信息的能力让现有的语音助手看起来很蠢。

但换句话说,如果能在语音助手上实现类似 ChatGPT 理解复杂信息的能力,Siri 和小爱同学是不是就能重获新生?

至少很多人已经开始尝试了。

个人开发者的尝试

ChatGPT 出现后不久,互联网上其实就有了一大堆的新想法,声量最大的一个是改变「搜索」,如今已经成为了搜索引擎巨头的共识,微软必应已经在测试,谷歌和百度也提前进行了预告。而另一方面,也有不少人在惊叹于 ChatGPT 的自然语言沟通能力之余,期望会推出语音助手版本的 ChatGPT,替代掉目前不堪一「谈」的语音助手。

在今年又一轮爆发之后,尽管我们还是没看到 OpenAI 或者微软推出对应的语音助手版,但已经有开发者进行了大量的尝试。

xiaogpt,图/GitHub

在全球最大的代码托管平台 Github 上,就有开发者尝试将 ChatGPT 接入小爱同学,Star 数已经达到了 1.3k。据项目介绍,只要有 ChatGPT 的账号、小爱音箱、正常连接 ChatGPT 的网络以及 python 3.8+,人人都可以在小爱音箱上使用「ChatGPT 版小爱同学」。

原理上很简单,唤起小爱同学后,以「帮我」开头询问的问题会自动以文本形式发送一份给 ChatGPT,同时会屏蔽小爱同学原本的回答,替换成「正在问 GPT,请耐心等待」,而 ChatGPT 生成的文本则会被小爱同学通过 TTS(语音合成技术)进行语音回答。

从开发者的演示显示,整个过程足够流畅,实际回答也远超小爱同学原本的「智力」。(具备条件可搜索 GitHub 项目「xiaogpt」)

演示,图/YouTube

不仅是小爱同学,另一位更为大众调侃的「智障」语音助手——Siri,实际上更早就被开发者尝试接入 ChatGPT。

围绕 Siri 其实有不少尝试,其中国内开发者@Yue-Yang 最近就以「快捷指令」形式连接了 Siri 和 ChatGPT,让 Siri 变成真正的 AI 聊天机器人。在 GitHub 或者「小众软件」上你都能找到对应的快捷指令——智能聊天,不过使用条件是需要申请 OpenAI 的付费 API。

「ChatGPT Siri」在原理上与「xiaogpt」类似,利用 OpenAI 的 API(应用程序接口)和 iOS 的特性,先将语音指令转换为文本再传递给 ChatGPT,收到回答后再让 Siri「读」出来。在 B 站上,通过搜索「ChatGPT Siri」可以查看对应的演示。

ChatGPT Siri,图/GitHub

当然,以上两个项目都是个人开发者的尝试,也包括其他类似的项目,不管是使用体验还是上手门槛,都并不适合普通用户。考虑到语音助手的技术、产品和生态,大公司的入场很可能降低门槛、提高整体的使用体验。

问题在于意愿和能力,很多公司其实也看到了站在 ChatGPT 的「肩膀」上重新打造语音助手的可能性,但在全球范围内,真正同时手握 AI 能力和语音助手背后生态的公司总共也就那几家。

巨头的入场,不远了

与搜索一样,ChatGPT 不可能直接取代现有的语音助手。一方面语音交互的优势在于直接、易上手,很多任务通过触控、文字输入等方式不仅繁琐、更耗时间,同时对于老人、小孩等用户也偏于复杂,自然的语音交互则能比较轻松地实现。另一方面,ChatGPT 并不能对现实层面进行直接干预,比如我们用 Siri 或者小爱同学操控空调、扫地机器人等。

ChatGPT,或者说生成式 AI 更大的价值在于通过强大的自然语言理解和沟通能力,来改善语音助手的使用体验。

小爱同学 5.0 发布现场,图/小米

过去我们总抱怨 AI 太笨,要么答非所问,要么干脆就是「我没有明白」,基本几轮对话就会感到心累,转向对功能性的需求,比如天气、问题查询、智能家居操作等。相反,ChatGPT 的对话能力则基本不用担心,尽管可能会有错误信息,但至少不会像 Siri 和小爱同学那样沟通成本太高。这也是多年的发展停滞之后,语音助手的关键机会所在。

2 月底,微软在推出支持 AI 对话的新必应之后,又支持了 Android 和 iOS 版本,并且在 AI 对话中第一次增加了语音对话功能,用户如果使用语音开启对话,新必应也会使用语音回应。不过就现在而言,新必应的语音对话功能还仅限于对话,并不能用来进行一系列操作,比如在手机上唤起某个系统或应用的功能,也不支持设置为默认的语音助手。

语音功能加入,图/微软

此外,微软自家的 Windows 平台也还未支持,目前为止尚未流出 Cortana 或其他新语音助手加入类 ChatGPT 能力的消息。

而更早些时候,小度官方在 2 月初宣布,AI 语音助手小度将在未来融合百度文心一言的全面能力,同时在此基础上还将打造针对智能设备场景的人工智能模型「小度灵机」并应用到小度全系产品。而据小度官方数据,搭载小度的智能设备已经进入了 4000 万户家庭。

当然,按照百度此前的规划,文心一言要在本月才上线测试,距离小度全面接入文心一言的显然还需要一段时间。

另一方面,谷歌也早早看到了这一点。2021 年的 I/O 大会上,谷歌就首次宣布将 LaMDA 大语言模型的对话能力整合入 Goolgle Assistant、搜索和 Workspace。今年 2 月,谷歌推出了类 ChatGPT 的聊天机器人 Bard 之后,接入 Google Assistant 似乎也是题中应有之义,包括 9TO5Google、《连线》杂志也认为谷歌应该这么做。

就像人人都知道语音助手的「蠢」,所有人也看到了 ChatGPT 让语音助手们至少在理解人类语言和对话上「变聪明」的很大可能。

「贾维斯,有时在你学会走之前得先跑起来」,图/《钢铁侠》

过去我们都畅想过,有一个数字语音助手可以在日常生活中帮我们解决各种需求,就像《钢铁侠》里的贾维斯,现实是 Siri 和小爱同学们距离听懂人类的话还差很远,充斥着各种「不明白」「听不懂」。

的确,现实世界的技术还赶不上科幻世界的想象很正常,但 ChatGPT 背后强大的对话语言能力,无疑可以让语音助手们能够更流畅地与我们对话,让我们更感觉在对话的是一个「智商在线」的 AI 助手,而非对牛弹琴。而对于智能音箱和智能家居厂商,这也意味着更高的用户粘性和使用率。

更或许,当 AI 越来越聪明并理解人类,智能家居乃至物联网的未来也会随之发生巨变。

最新文章
血压高和喝酒关系大吗
血压高的患者可以适量喝红酒,但不建议过多饮用。红酒中含有的多酚类物质有助于增强一氧化氮的释放,而一氧化氮能够松弛平滑肌细胞,从而使外周血管扩张,达到一定的降压效果。但是需要注意的是,虽然红酒中的这些成分有一定的好处,但并不
语音助手与chatgpt
语音助手与ChatGPT:为人机交互带来全新体验随着人工智能技术的快速发展,语音助手和自然语言处理技术成为了人机交互领域的热门研究方向。语音助手被广泛应用于智能音箱、智能手机等设备中,通过语音指令实现信息检索、语音识别、语音合成
谷歌每年260亿美元买断搜索入口,法院判为垄断行为,可能重塑互联网市场
以“不做恶”为座右铭的谷歌,终于被判定为在市场上采取了“做恶”的行为。美国联邦法官做出裁决,谷歌非法垄断了搜索市场。根据法院判决,谷歌的行为,违反了反垄断的谢尔曼法的第二条,即在美国市场上通过排他性的分销协议,建立起了一般
驻马店2020高考查分网站入口
河南省2020年高考成绩查询时间7月25日0时   河南省2020年高招各批次最低录取控制分数线7月25日0时公布,考生即可通过多种方式查询高考成绩,全省考生“一分一段表”也将同时发布。  高考查分渠道有:河南省教育厅网站、河南省招生办公
高清美女写真生成!用AI一键打造你的虚拟女友!
第二步:选择生成类型 进入页面后,你将看到多个选项,选择“生成美女写真”,系统会引导你进入相应的界面。第三步:上传或选择图片 你可以选择上传自己的照片,或者系统提供的样板图,随后根据指引进行基础设置,如选择风格或特效等。第四
为什么AI目前搞不定UI界面设计?
在人工智能(AI)技术飞速发展的今天,其在各个领域的应用不断拓展,从自动驾驶到智能助手,AI的身影无处不在。然而,在UI界面设计这一领域,尽管AI技术被寄予厚望,但其实际应用效果却远
蜘蛛池增加百度蜘蛛,提升网站权重与流量的高效策略,蜘蛛池效果
蜘蛛池是一种通过集中多个网站资源,吸引搜索引擎蜘蛛(如百度蜘蛛)频繁访问,从而提升单个或多个网站权重与流量的策略。通过合理设置蜘蛛池,可以吸引更多百度蜘蛛访问,提高网站收录和排名,进而增加流量。蜘蛛池还可以实现资源互补,提
钢研纳克涨0.39%,中期趋势方面,下方累积一定获利筹码。近期该股有吸筹现象,但吸筹力度不强
4、2019年12月4日公司在互动平台称:中实国金作为全国分析测试人员能力培训委员会秘书处和授权培训中心,为全国分析检测人员提供技术能力培训。中实国金是公司全资子公司。5、公司在大飞机用钢铁材料检测占据重要位置,成为大型客机用钢铁
黄南藏族自治州路基回填土下沉注浆2024年排行榜推荐
黄南藏族自治州路基回填土下沉注浆2024年排行榜推荐标题:黄南藏族自治州路基回填土下沉注浆2024年排行榜推荐随着我国基础设施建设的不断推进,路基回填土下沉注浆技术在公路建设中发挥着越来越重要的作用。黄南藏族自治州地处青藏高原,地
美国研究生申请的几大潜规则!留学生必看!
美国研究生留学申请的相关问题,有很多打算申请留学的同学咨询,今天高途留学小编就收集了关于美国研究生申请的几大潜规则的信息,供申请的同学参考,帮助同学们留学申请做好准备。3.5是GPA的分水岭美国研究生院设有明确规定,仅当学生的GP
相关文章
推荐文章
发表评论
0评