天天报道:OpenAI宣布开源多语言语音识别系统Whisper
尽管包括 Google、亚马逊和 Meta 在内的科技巨头,都将各自开发的功能强大的语音识别系统置于其软件和服务的核心地位。但在人工智能和机器学习领域,语音识别仍是一个颇具挑战性的话题。好消息是,今日 OpenAI 隆重地宣布了 Whisper 的开源 —— 可知作为一套自动语音识别系统,官方宣称它能够实现多种语言的强大转录、并将它们翻译成英语。
访问:
(资料图)
Parallels Desktop 18 今年首次促销:限时75折
(来自:OpenAI Blog)
OpenAI 表示,Whisper 的不同之处,在于其接受了从网络收集的 68 万小时的多语言和“多任务”训练数据,从而提升了该方案对独特口音、背景噪声和技术术语的识别能力。
官方 GitHub 存储库上的概述称:
Whisper 模型的主要目标用户,是研究当前模型稳健性、泛化、能力、偏差和约束的 AI 研究人员。
与此同时,它也很适合作为面向开发者的自动语音识别解决方案尤其是英语语音识别。
感兴趣的朋友,可以从托管平台上下载 Whisper 系统的多个版本,其模型在大约 10 种语言上展现出了强大的 ASR 结果。
此外假如在某些任务上加以微调的话,它们还有望在语音活动检测、讲述者分类等应用场景下表现出额外的能力。
架构示意
遗憾的是,Whisper 尚未在相关领域得到强有力的评估、且模型也有其局限性 —— 有其在文本预测领域。
由于该系统接受了大量“嘈杂”的数据训练,OpenAI 决定提前给大家打一剂预防针,警告称 Whisper 可能在转录中包含实际上未讲述的单词。
原因可能是 Whisper 既试图预测音频中的下一个单词、又试图转录音频本身。
流程示例
此外 Whisper 在不同语言场景下的表现也不大一致,尤其涉及在训练数据中没有很好被代表的语言的讲述者时,其错误率也会更高。
不过后者在语音识别领域早已不是什么新鲜事,即使业内首屈一指的系统,也一直受到此类偏差的困扰。
参考斯坦福大学在 2020 年分享的一项研究结果 —— 相较于黑人,来自亚马逊、苹果、Google、IBM 和微软的系统,针对白人用户的错误率要低得多(大约 35%)。
Whisper 有约 1/3 的音频数据集为非英语
即便如此,OpenAI 还是认为 Whisper 的转录功能,可被用于改进现有的可访问性工具。其在 GitHub 上写道:
尽管 Whisper 模型不适用于开箱即用的实时转录,但其速度和大小表明,其他人可在此基础上构建近乎实时的语音识别和翻译应用程序。
建立在 Whisper 模型之上的有益应用程序,其价值切实地表明了这些模型的不同性能,有望发挥出真正的经济影响力。
我们希望大家能够将该技术积极应用于有益目的,使自动语音识别技术更易获得改进、让更多参与者能够打造出更负责任的项目。
在速度和准确性的双重优势下,Whisper 将允许对大量通信提供可负担得起的自动转录和翻译体验。
相关文章:
[视频]OpenAI展示DALL-E 2:AI图像生成器支持编辑图像了
OpenAI的DALL-E绘画AI 已能够扩展创作更大的图像
过滤系统升级:OpenAI再次开放DALL-E 2的面容编辑功能
推荐
-
与亚马逊Audible展开竞争 Spotify在美国推出有声读物服务
已在美国推出有声读物服务,此举欲与亚马逊的 Audible 展开竞争。Spotify 称,用户可在 Spotify Ap...
来源:TechWeb -
YouTube视频网站中“不感兴趣”按钮几乎没有任何作用 类似相关视频还会出现
有一项新的研究发现,即使用户对 YouTube 中某些类型视频选择了不感兴趣,但是类似相关的视频还会出现...
来源:凤凰科技 -
-
-
Instagram短视频功能发展正趋于停滞 观看时长不及TikTok十分之一
几个月来 Instagram 一直在努力发展其短视频项目 Reels,但据一份内部报告显示,短视频功能的发展正...
来源:TechWeb -
-
-
-
-
AT&T投资600万美元推出数字素养计划 预计有超过65000人受益
美国电信运营商AT&T计划捐赠600万美元,用于推动覆盖全美范围的数字素养计划,预计有超过65000人受益于...
来源:人民邮电报
直播更多》
-
构建网络安全保障体系 天津滨海高新区在信创安全领域持续发力
9月上旬,天津滨海高新区内企业麒麟软件...
-
构建网络安全保障体系 天津滨海高新区在信创安全领域持续发力
9月上旬,天津滨海高新区内企业麒麟软件...
-
解放大量人力物力 智慧渔政网络为执法插上科技翅膀
有人正在长江非法垂钓!近日,武汉市农业...
-
将加强政策引导 广西管局推进自贸区工业企业工业互联网建设
近日,广西信息通信业与中国(广西)自由...
-
快手高级副总裁带队国际化业务一个多月 对部门组织架构进行调整
快手高级副总裁马宏彬在带队国际化业务...
-
特斯拉公司目前正聚焦中国市场 并打算进一步扩大在华生产
特斯拉公司目前正聚焦中国市场,并打算...
资讯更多》
焦点
- 厦门国家火炬高新区专精特新企业培育项目开班 50名备企业高管开启研学之旅
- 为禁捕退捕装上“数字眼” 中国联通助力长江黄河流域水域治理
- 顺丰同城寄丢20克黄金保价8000元只赔2000元 当事人质疑保价意义何在
- SK明年将在韩国投资73万亿韩元提升产能 未来5年还将投入25万亿韩元
- 大理州首个文旅行业5G应用 5G智慧文旅项目落户银都水乡
- 德国柏林国际消费电子展全面恢复线下举办 大量“智慧家居”类产品吸引眼球
- 中俄边境地区无线电频率协调工作组及专家组会谈 近日以线上视频形式召开
- 浙江移动物联网连接数突破1亿 率先迈入万物智联时代
- 全力构建数据出境的“安全屏障” 9月1日起《数据出境安全评估办法》正式施行
- 侵犯mRNA技术平台核心专利 莫德纳对辉瑞和BioNTech提起诉讼