分享好友 最新动态首页 最新动态分类 切换频道
百度新款语音识别模型,准确率飙升30%,还有三款AI语音芯片模组
2024-12-25 18:28

智东西11月28日消息,在百度大脑开放日上,百度语音首席架构师贾磊推出了一款新的语音识别模型——全名叫“基于复数CNN网络的语音增强和声学建模一体化的端到端语音识别模型”,它与业内几乎所有语音识别方案都不一样,打破了传统远场语音识别技术的流程,能够将语音识别准确率提高30%以上。

百度新款语音识别模型,准确率飙升30%,还有三款AI语音芯片模组

▲百度AI技术生态部总经理喻友平、百度语音首席架构师贾磊

在采访中,贾磊告诉智东西,这款语音识别模型是百度前后历时近一年打造的。在三年之内,随着这一技术的不断发展成熟,远场语音识别的准确率将能达到近场语音交互的水平,未来远场语音交互将会是主流。

百度AI技术生态部总经理喻友平则推出了三款基于百度鸿鹄语音芯片的硬件模组及开发板,以及基于智能家居、智能车载、智能IoT设备这三大场景的行业解决方案人,让智能硬件厂家更好、更快地集成AI语音能力。

百度CTO王海峰在还开场致辞中表示,目前,百度语音技术平台每天调用量已经超过了100亿次。

一、颠覆传统远场语音识别流程,准确率提高30%

贾磊表示,传统远场语音交互技术,首先要对声音进行数字信号处理(信号增强、波束生成等),接着再对其进行语音识别,涉及数字信号处理和语音识别这两大学科。

而今天百度推出的基于复数CNN网络的语音增强和声学建模一体化的端到端语音识别模型则是一款几近颠覆式的新模式,它打破了上述传统流程,以一套深度学习模型代替整个流程。

这套模型能够直接输入多路麦克风信号,输出目标语音文字,参数调整只有字准确率这唯一的优化目标,不需要任何声学先验知识。

贾磊说,目前除了谷歌之外,业内所有主要玩家的语音交互都采用都是传统的方式。但是随着识别率到达一定阶段,传统远场语音识别的准确率很难再进一步提高。

百度的这款新模型搭配百度鸿鹄语音芯片,能够将语音识别准确率提高30%以上。

在采访中,贾磊告诉智东西,即便设备没有搭载鸿鹄芯片,而是搭载其他传统ARM芯片,这套新模型也能让远场语音识别、首次唤醒准确率大幅提升。

贾磊说,深度学习的下一步方向就是这种跨领域融合的技术,目前深度学习的端到端、跨学科整合方面正在快速发展,不断对已有学科进行着颠覆。

二、推出三款AI语音开发板+三大行业解决方案

喻友平则在现场推出了三款基于百度鸿鹄语音芯片的硬件模组及开发板,为智能硬件厂家提供软硬一体的解决方案,让智能产品更好、更快地集成远场语音交互能力。

同时,针对细分场景,喻友平还在现场推出了基于鸿鹄语音芯片的智能家居、智能车载、智能IoT设备这三大场景的解决方案。

喻友平说,百度大脑开放平台目前是国内服务规模最大的AI开放平台,当前,其开发者群体超过150万(主要是企业开发者)、有228项开放的技术能力、能够在24小时内快速集成。

而对于智能硬件来说,加入语音交互能力有三大主要难点:

1)唤醒、降噪、识别的语音算法要求高;

2)软硬件适配复杂、周期长;

3)硬件选型难;

而百度今天推出的三款硬件模组和三大行业解决方案正是为了解决这些问题所打造的。

三、王海峰:AI在应用场景中不断进化

百度CTO王海峰在开场致辞中表示,目前百度大脑已经开放了200多项能力,语音能力是其中的重要方面。

百度从2010年开始进军AI语音技术,2010年初开始全面布局人工智能技术,2011年下半年开始研究深度学习,2012年初正式立项研究开发基于深度学习的语音技术。

王海峰表示,人工智能是用电脑计算机模拟人的能力,人类在自然环境中不断进化,人工智能也在应用场景中不断进化。

当前,算力高速发展、算法持续提升、数据不断积累,从而推动AI技术不断进化。

同时王海峰还表示,目前,百度语音技术平台每天调用量已经超过了100亿。

四、语音AI落地各行各业

除此之外,来自创维、瓴岳、子杰宝贝、华智水稻、善行智能的百度合作伙伴也分别介绍了百度AI技术落地在家电、金融、护理、农业、智能眼镜等方面的落地。

创维AIoT研究院产品经理李凯表示,从2017年开始,创维就和百度进行了深度合作。创维集团AIoT研究院成立于2018年,专注于AIoT相关技术的研发与合作落地。

李凯告诉智东西,目前创维的“Swaiot小维智联”AI系统的设备部署量已经突破了千万台。创维电视目前也正在推进与百度鸿鹄语音芯片的合作落地。

最新文章
2024年佛山初三二模多少分数正常 二模成绩重要吗
  2024年佛山中考二模500分数正常。佛山初三二模成绩重要,佛山中考二模考试意味着自我评估和改进的机会,中考前的模考主要是进行大数据的筛查,判断整体学生的水平,佛山中考二模是最接近中考考题的一次模拟考试,所以佛山中考二模后如
3d笔记本电脑排行榜(3d笔记本电脑配置要求)
今天给各位分享3d笔记本电脑排行榜的知识,其中也会对3d笔记本电脑配置要求进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!1、戴尔 XPS 15 是一款高性能的笔记本电脑,非常适合3D建模。它配备了第10代英特尔酷睿
GPT4.0 App:人工智能的未来之路
GPT4.0 App:人工智能的未来之路GPT4.0 App是最新一代的人工智能应用,凭借其强大的深度学习模型,为用户带来了颠覆性的体验。GPT4.0 App在自然语言处理领域实现了突破性的进展,其语言理解和生成能力令人惊叹。借助GPT4.0 App,用户可以轻
2024中国铁建·西派海上(西派海上)官方网站-百度百科-上海房天下
2024年上海楼市,给我们带来太多惊喜。售楼处电话:400-883-2210{已认证}案场限流 看房提前来电预约登记售楼处电话:400-883-2210{已认证}为了不影响您的生活,看房请务必致电与销售确认时间特别是在今年的尾声,一个约8000㎡超级示范区横
2024年吉林监理公司加盟成立分公司的问题+2024top5监理公司加盟排名一览
2024年吉林监理公司加盟成立分公司的问题+2024top5监理公司加盟排名一览
2024年F1车手收入排行榜Top10
在2023赛季凭借22场比赛中的19场胜利缔造F1历史上最具统治力的赛季后,马克斯·维斯塔潘在2024赛季迎来了更大的挑战。然而,这位27岁的红牛车队车手依然以63分的优势成功卫冕总冠军。尽管赛场竞争愈发激烈,他在收入上却进一步拉大了与其他
2019年中国智能音箱市场出货量成全球主力 天猫精灵持续领跑
相信接触过漫威电影的朋友都曾羡慕过钢铁侠有一个随时陪伴在身边的老伙计“贾维斯”。无论在家里还是在战衣里,只要钢铁侠一呼唤,贾维斯就能给出应答。作为钢铁侠自己研究的人工智能助手,贾维斯已经具备了基础的针对当下环境的自我反馈能
docker容器管理ui有哪些
容器管理ui工具有:1、portainer,是一个轻量级的基于web的docker管理gui;2、kitematic,是一个gui工具,可以更快速、更简单的运行容器;3、lazydocker,基于终端的一个可视化查询工具;4、dockstation,一款桌面应用程序;5、docker desk
360借条逾期了可以协商延期还款吗?具体流程是什么?
360借条逾期了可以协商延期还款吗小编导语在现代社会中,借贷已经成为人们日常生活中的一部分。特别是随着互联网金融的迅速发展,许多线上借贷平台如360借条为用户提供了便捷的借款服务。有时候由于各种原因,借款人可能会面临逾期还款的情
相关文章
推荐文章
发表评论
0评