(原标题:腾讯开放天籁AI降噪技术 “科技公益互助计划”首个场景落地)
伴随数字时代的全面到来,科技助力公益已成为行业趋势,数字科技也正在成为社会公益事业发展的新引擎。
作为“科技公益互助计划”的首个落地场景,值9月27日国际聋人日之际,腾讯多媒体实验室联合腾讯公益慈善基金会、深圳市信息无障碍研究会等机构召开发布会,宣布发起“天籁行动”,通过面向公益开发者、设备厂商、NGO及行业免费开放腾讯天籁AI音频技术,帮助听障人群解决“听不清”难题,并邀请歌手周深作为公益大使,呼吁全社会关注听障人士身心康复,构建信息无障碍环境。本次“天籁行动”发起,也是腾讯继AI寻人、守护者计划等项目实践后,又一个“科技向善”落地的典型案例。
发布会上,腾讯多媒体实验室高级总监商世东直言,在过去与听障人群的多次接触中,他了解到一些听障人群花费高昂的费用安装了人工耳蜗,但在机场、商场等比较嘈杂的公共环境中,依然面临着“听不清”的困扰。
基于此,商世东和团队萌生了通过AI算法改善听障人群听觉体验的想法,并找到了国内最大的人工耳蜗厂商之一——诺尔康(Nurotron),双方一起讨论在当前人工耳蜗软硬件局限条件下的解决方案,经过长达半年的技术验证,从架构上最终确定了“手机伴侣+人工耳蜗”的联合解决方案。
据诺尔康实验检测数据显示,天籁技术与人工耳蜗结合后,语音识别性能大幅提升,平均识别率达到96.28%,其中带噪语音识别率为93.38%,环境噪音中声音识别率达到94.24%;在手机App中植入天籁技术,手机双麦阵列降噪的信噪比提升 20dB,MOS分提升了0.3-0.5,对于改善听障人群听觉体验有着积极效果。
除此之外,腾讯优图实验室此前还利用深度学习技术,突破“跨年龄人脸识别”,助力警方寻回被拐十年儿童。对此,腾讯表示,公司希望充分发挥技术的社会价值,让AI给社会带来更多可能。
实际上,据商世东介绍,作为新一代实时音频技术,腾讯天籁同时也是腾讯会议背后的关键技术,致力于让用户在实时音视频会议中可以“听得见、听得清、听得真”。腾讯会议通过嵌入腾讯天籁技术,解决了实时音视频会议场景下的各种挑战。
商世东曾在9月11日的腾讯全球数字生态大会视频通信云专场上指出,与传统会议场景相比,实时音视频的云视频会议面临着非常大的挑战。主要包括以下几个方面:音频外设的多样化(客户端,高清音质)、网络条件差异(Ethernet,4G,W i f i)、声学环境复杂(远距离/混响/本底噪声)、入会形式复杂(同地多设备)、噪声类型多变(平稳,非平稳噪声)、客户端的音频设备差异性(蓝牙,有线,内置)、与传统会议设备的兼容、用户需求的多样化(音频内容分享)及现网质量评估的复杂性。而天籁音频技术是实时端到端音频通信的完整解决方案。
目前,天籁音频技术规划的关键策略包括音频通信核心体验、声音场景分类和处理、音频痛点难点问题及差异化体验,最终目标则是提升语音可懂度、自然度、舒适度。
统计数据显示,疫情期间,搭载腾讯天籁技术的腾讯会议,不仅为企业之间构筑了沟通通道,加速了复工复产,更在经济层面创造了巨大的价值与贡献。得益于天籁技术的加持,腾讯会议上线两个月内日活用户就超过1000万,目前用户规模已经突破1个亿,国际版应用也在全球100多个国家和地区上线,助力全球抗击疫情。据北京大学互联网发展研究中心发布的报告显示,今年1月至5月期间,腾讯会议直接节约社会成本达到714亿元。
商世东表示,未来,腾讯将投入更多技术力量,与公益伙伴携手,推动公益行业深耕透明度、数字化、生态效率,持续探索从科技向善到科技公益互助模式的延展,不断扩展公益生态的广度和深度。
(文章来源:经济观察网)