分享好友 最新动态首页 最新动态分类 切换频道
OpenAI最新发布:只需15秒音频,Voice Engine即可帮助失语者“重获声音”
2024-12-26 11:28

今日凌晨,OpenAI 在官网分享了他们在 AI 语音合成方面的一些进展——公布了一个名为“语音引擎”(Voice Engine)的模型的小规模预览的初步见解和结果。

OpenAI最新发布:只需15秒音频,Voice Engine即可帮助失语者“重获声音”

据介绍,该模型使用文本输入和单个 15 秒音频样本来生成与原始说话者非常相似的自然语音。值得注意的是,一个只有 15 秒样本的小型模型就能生成富有感情和逼真的声音。

早在 2022 年底,OpenAI 便开发了 Voice Engine 并将其用于支持文本到语音 API 中的预设语音以及 ChatGPT 语音和朗读。

今天,通过一些实际案例,OpenAI 分享了一些 Voice Engine 的早期应用。

例如,使用 Voice Engine 帮助恢复一名因血管性脑肿瘤而失去流利语言能力的年轻患者的声音。

此外,Voice Engine 还可以被用来提供阅读帮助、翻译内容、为不会说话的人群提供支持等。

1)通过声音自然、富有感情的声音为非阅读者和儿童提供阅读帮助

这些声音代表了更广泛的说话者,而不是预设的声音。Age of Learning 是一家教育技术公司,该公司一直在使用 Voice Engine 生成预设的画外音(voice-over)内容。他们还利用 Voice Engine 和 GPT-4 创建实时、个性化的回应,与学生互动。

2)翻译视频和播客等内容

Voice Engine 可以让创作者和企业可以用自己的声音流利地向世界各地更多的人传播。据 OpenAI 介绍,HeyGen 是这方面的早期应用者之一。HeyGen 是一个人工智能视觉故事平台,通过使用 Voice Engine 进行视频翻译,将演讲者的声音翻译成多种语言,并覆盖全球受众。用于翻译时,Voice Engine 会保留原说话者的母语口音:例如,用法语说话者的音频样本生成英语,就会产生带有法语口音的语音。

3)为不会说话的人群提供支持

Voice Engine 可以为患有影响语言的疾病的人群提供治疗应用,为有学习需求的人群提供教育增强功能等。Livox 是一款人工智能替代性交流应用程序,为辅助性和替代性交流(AAC)设备提供支持,使残疾患者能够进行交流。Voice Engine 能够为不会说话的人群提供多种语言的独特非机器人语音。用户可以选择最能代表自己的语音,对于多语种用户,每种口语都能保持一致的语音。

此外,Voice Engine 还通过改善偏远地区的基本服务提供深入全球社区。例如,Dimagi 正在为社区卫生工作者开发工具,从而提供各种基本服务,如“为母乳喂养的母亲提供咨询”。为了帮助这些工作人员提高技能,Dimagi 使用 Voice Engine 和 GPT-4 以每位工作人员的主要语言(包括斯瓦希里语或更加非正式的语言)提供互动反馈。

OpenAI 表示,由于合成语音有可能被滥用,他们对更广泛的发布采取了谨慎和知情的态度,选择在此时预览但不广泛发布这项技术。

他们在与这些合作伙伴签订的条款中,要求获得原发言人的明确和知情同意,且不允许开发人员为个人用户创建自己的声音。这些合作伙伴还必须向受众明确披露,其听到的声音是人工智能生成的。

此外,OpenAI 还实施了一系列安全措施,包括水印以追踪 Voice Engine 生成的任何音频的来源,以及主动监控其使用情况。

OpenAI 表示,他们鼓励在未来加快开发和采用追踪视听内容来源的技术,让人们始终清楚自己是在与真人互动还是在与人工智能互动,并帮助公众了解人工智能技术的能力和局限性,包括人工智能欺骗性内容的可能性等。

参考资料:

最新文章
KingRoot全面支持一加手机X、OPPO Find 7等机型一键Root
大部分使用Android系统手机的用户,始终难逃越用越卡顿的命运。归根到底,是由于多数APP应用在关闭后仍常驻后台,占据手机内存,直接拖慢了手机的运行速度,同时流量、电量等资源消耗速度也会加快。因此,通过一些手段遏制后台APP自启就十
36漫画免广告版下载安卓官网
36漫画免广告版是一款很有意思的看漫画软件!36漫画免广告版为用户带来了各种各样的漫画,每天都有很多新的漫画更新,可以满足所有用户的漫画阅读需求,这里所有的漫画都是全彩高清,内容也是充满了诸多精彩,喜欢的伙伴就请下载吧!1.这个
Excel筛选的数据如何自动排序?
在Excel中筛选数据后,可以使用以下方法来实现自动排序:1. 使用Excel的排序功能:选中需要排序的数据范围,然后点击Excel界面上的排序按钮(通常位于“数据”或“开始”选项卡中)。根据需要选择升序或降序排序方式,然后按照需要的排序依
executemany效率问题
1. Excel用来分析数据,至少要有一份原始数据和对于的分类汇总数据,这两种数据在一项任务中,应该是存放在同一个Excel文档中的,在书籍中,把他们叫做源数据表和分类汇总表。用户输入源数据表,根据相关的业务需求,利用Excel自动生成分类
5G赋能教育变革!看西电如何打造未来教育“样板间”
2024年10月工业和信息化部、教育部联合发布了“5G+智慧教育”应用试点全国典型项目及通过验收项目名单标志着为期两年的首批“5G+智慧教育”应用试点工作圆满完成其中“西安电子科技大学‘5G+智慧教育’探索实践”项目获评“‘5G+智慧教育’
Ai照片换脸系统AI解决方案一站式提供1
我们可以开发的系统如下:ai明星变脸系统,AI写真系统,AI论文生成与ai论文降重系统,AI生成图片系统,AI生成视频系统,AI生成动漫系统,ai生成画册系统,AI生成小说系统,ai证件照生成系统,AI美女跳舞生成系统,ai修图,ai微信聊天,AI客服
332期[辉煌小哥]排列五单双精准预测
332期辉煌小哥排列五单双精准预测:双单单双双,双单单双单,双单双单单,双单单双单,单双双单双331期辉煌小哥排列五单双精准预测:双双单双单,双双单单双,双双单双单,单双双单双,双单单单双开:71227(单单双双单)330期辉煌小哥排列五单双精准预
AI大模型概念上市公司龙头名单,收好!(2024/12/16)
据南方财富网概念查询工具数据显示,AI大模型概念上市公司龙头有:1、创业黑马:AI大模型龙头股。2024年第三季度,创业黑马实现营业总收入5793.13万元,同比增长-24.7%;实现扣非净利润-1002.19万元,同比增长-216.96%;毛利润为3559.58万
2024年正版资料免费大全下载安装最新版|释义成语解释0.484818748
2024年正版资料免费大全下载安装最新版及成语解释精选集 0.484818748随着科技的飞速发展和互联网的普及,信息获取变得前所未有的便捷,在这样一个时代,我们不仅能够轻易地找到各种正版资料,还能免费下载和安装最新版的软件,对于成语的学
相关文章
推荐文章
发表评论
0评