3月，百度智能云的AI技术又有上新和优化了

3月，百度智能云的AI技术又有上新和优化了

2024-12-26 22:32

亲爱的读者朋友们，3月，百度智能云的AI技术又有上新和优化啦。在新增AI技术方面，我们在语音技术、人脸与人体识别、语言处理基础技术、文字识别等方面都有上新。在AI技术模型优化方面，我们提升了文字识别和图像审核的准确率和易用性，让企业以最简单、最便利的方式享受到AI。

让我们详细看一下吧。

新开放AI技术能力

我们按照技术分类来梳理。

语音技术：又快又准

这一次重点推出了语音识别极速版，速度更快，适用范围更广。

语音识别极速版，支持60秒内音频使用REST API方式进行调用，简单易用。采用国际领先的注意力（Attention）模型，实时率小于0.1，5s音频不到500ms即可完成识别过程，极大提升语音交互体验。近距离安静环境下，识别准确率可达98%，为手机、小程序、智能交互设备的语音搜索、语音输入提供更高效的识别能力。

语音识别极速版上线即带来“限时领取最高80W免费调用量”的福利活动，机不可失！

另外，呼叫中心实时语音新增REST API调用方式，大幅降低接入难度，可截取通话中有效音频进行识别，减少呼叫中心语音识别成本。

人脸识别：新增人脸融合

人脸融合可以将两张人脸进行融合处理，生成的人脸同时具备两张人脸的外貌特征，意味着你可以将两个心爱的偶像的脸放在一起生成“400年”才见的脸。此服务也支持对图片进行涉黄涉暴及政治人物过滤，让人脸识别服务业务更安全。

人体分析：免费调用额度升级，在线购买QPS每月200元起

人体关键点识别、人体检测与属性识别、人流量统计、人像分割、手势识别等5个接口免费调用额度升级。个人用户每日免费调用额度提升至50000次，并发量为2QPS；完成企业认证后，立享无限制调用，并发量提升至5QPS。如需更高并发量，可以在控制台自助购买QPS，可按月、按天两种模式灵活搭配购买。

智能写作平台重磅上线

众多粉丝期待的智能写作平台终于上线了，这是基于百度深耕多年的自然语言处理技术（NLP）和知识图谱技术（KG）打造的应用平台，可提供自动写作和辅助写作技术，内置丰富的数据和素材，配置简单、生成快速，零代码基础也可以轻松使用。可应用于：智能春联、智能写诗、结构化数据写作、热点事件脉络梳理、热点发现等场景中。

语言处理基础技术

► 情感倾向分析定制版重磅上线。使用情感倾向分析定制版功能，你可以上传适合自身应用场景的情感极性标注语料，在通用模型基础上进行优化训练，满足在专属场景下的更高准确率要求。

► 15个接口提供低价购买QPS服务。为了提供更稳定可靠的技术服务，满足有更高并发需求的用户，NLP在提供5QPS免费并发量基础上，向有更高并发要求的用户提供低价QPS购买服务。支持自助购买QPS的15个NLP技术接口为：文本审核、词法分析、词法分析（定制版）、情感倾向分析、短文本相似度、评论观点抽取、评论观点抽取（定制版）、依存句法分析、词向量表示、词义相似度、对话情绪识别、文本纠错、文章分类、文章标签、DNN语言模型。

文字识别OCR：两款新品正式发布

► VIN码识别。可对车辆车架上、挡风玻璃上的VIN码进行识别，识别准确率为90%，用户可通过文档自行调用测试，提供200次/天的免费使用次数。

► 护照识别。支持对中国大陆护照个人资料页所有10个字段进行结构化识别，识别准确率为90%，用户可通过文档自行调用测试，提供200次/天的免费使用次数。可应用于境外旅游产品预订、酒店入住登记等场景。

图像处理四款新品上线

本次四款新品注重在不同场景下的图像处理技术，重建高清图像。

► 图像去雾上线。对浓雾天气下拍摄，导致细节无法辨认的图像进行去雾处理，还原更清晰真实的图像，适用在安防监控、车载系统场景下，对受浓雾天气影响拍摄的视频、图像进行优化处理，重建更可辨析的监控材料。

► 图像对比度增强上线。调整过暗或者过亮图像的对比度，使图像更加鲜明。适用于海量图片优化、监控视频优化、彩印照片美化等场景。

► 图像无损放大上线。可将图像在长宽方向各放大两倍，保持图像质量无损。多用于安防监控、车载系统场景中视频或图像无损放大优化，重建更可辨析的监控材料，以及彩印照片美化等场景。

► 黑白图像上色邀测中。智能识别黑白图像内容并填充色彩，使黑白图像变得鲜活。可应用于主题活动小程序或网页等。

图像识别两款新品，适用于更多菜品

► 果蔬识别。可精确识别近千种水果和蔬菜的名称，适用于识别只含有一种果蔬的图片，可自定义返回识别结果数，可应用于零售结算和果蔬介绍等业务场景中。

► 自定义菜品识别。识别超过5万种菜品，支持创建属于自己的菜品图库，可准确识别图片中的菜品名称、位置，并获取百科信息，适用于多种客户识别菜品的业务场景中。

车辆分析：车辆属性识别邀测中

检测图像中的各类车辆，并针对小汽车识别11种外观属性，包括：是否有车窗雨眉、是否有车顶架、副驾驶是否有人等，可用于交通安防场景的特定车辆检测追踪。

AI技术模型优化

在技术模型方面，主要提升了相关技术的易用性和准确率。这样，企业应用AI技术的门槛更低，应用效果也将更好。

OCR增值税发票识别重磅升级

全新的模型和算法在响应时间和识别准确率上有了大幅提升，耗时骤降66%，从3秒缩短为1秒。准确率方面在单位、数量、税率三个字段有30%以上的提升，价税合计（小写）、规格型号、销售方地址电话、购买方地址电话等均有10%左右的提升。

OCR行驶证识别

新增对行驶证副页所有字段的识别能力，识别准确率高达99%，应用的范围和领域更多了。

图像审核

色情识别模型优化升级。此次主要针对欧/美/非的人物特征进行了专项优化升级，在欧/美/非的人物直播、社交场景下，色情违规图片识别的准确率提升20%，快速精准，解放审核人力。如果你的应用要走向海外，这次升级不容错过。

定制化平台与工具增加新功能

通过定制化平台与工具，可以零算法零门槛实现业务定制，满足不同类别的业务需求，本次升级如下：

► 升级EasyDL定制化训练及服务平台

新增高精度算法，离线识别更准确；对IOS、Android系统新增按产品线授权，方便多台终端设备同步激活服务；EasyDL图像识别现已支持生成Linux、Windows操作系统的离线SDK。

► 在理解与交互技术UNIT中，新增两个功能

一个功能是在UNIT的预置技能中，增加了成语解答。

另一个功能是对已有的预置技能进行干预的能力上线。用户可以根据自己的业务需求添加词槽的词典值，干预平台上已有的预置技能，提升预置技能的对话效果。首批开发的可干预的预置技能为：订机票、打电话、订咖啡、音乐、故事、闹钟、通讯录等，后续将为大家开放更多可干预的预置技能，敬请期待。

来体验百度AI体验中心小程序

最后，我们也同步更新了百度AI体验中心微信小程序，你可以在这个小程序中，体验百度AI的诸多能力。本次，我们新上线的能力有：地标识别、定额发票文字识别、机动车销售发票文字识别、机打发票文字识别等4项能力体验。

听说体验过的小伙伴们都忍不住分享到朋友圈！目前“百度AI体验中心”共有38项AI能力可体验。关注百度智能云微信公众号，即可体验

免责声明：此文内容为第三方自媒体作者发布的观察或评论性文章，所有文字和图片版权归作者所有，且仅代表作者个人观点，与极客网无关。文章仅供读者参考，并请自行核实相关内容。投诉邮箱：editor@fromgeek.com。