新一代实时语音编码标准即将发布 2G网络也能开线上会议
2024年07月02日 09:57
来源: 南方都市报
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  南都记者获悉,由腾讯提议启动、推进的新一代实时语音编码行业标准AVS3P10进入公示阶段,即将正式发布,该标准以腾讯首款神经网络语音编解码器Penguins为原型。应用该标准,今后在线上会议、语音通话等实时音频场景,带宽要求大幅降低。这也意味着用户即使在电梯、地库、隧道等网络很差的环境,也能实现清晰流畅的语音通话。据悉,从2021年起,Penguins音频编码器已经在腾讯会议驾驶模式、弱网模式及QQ语音通话等场景中投入规模应用。

  通常在有限的带宽条件下,想要将声音高质量传递到接收方,需要压缩原始数据、去除冗余信息的语音编码技术。然而,目前基于EVS、OPUS等主流音频编解码的标准仍存在一大问题,即当码率降低到10kbps以下时,语音质量下降明显,这将影响用户通话体验。

  为应对该难题,腾讯会议天籁实验室联合腾讯AI Lab自研了腾讯首款神经网络语音编解码器——Penguins。据介绍,Penguins将AI与传统技术紧密融合,从算法研究、工程化、产品化层面做了系统性创新。

  而以腾讯首款神经网络语音编解码器Penguins为原型的AVS3P10标准,实现了6kbps下的高质量语音通信,即使在“2G”网络下也能实现清晰通话,且主观质量非常接近原始参考信号。同时,主观质量对标传统编码的中高码率情况下,编码效率提升200-300%。

  据悉,2021年起,Penguins音频编码器就在腾讯会议的驾驶模式、弱网模式及QQ语音通话等场景中投入规模应用,支持了亿级用户的流畅沟通。2023年3月,腾讯团队在AVS音频组主动提议启动实时语音编码项目,促进行业的技术进步。2023年6月,AVS工作组会议上,决定立项AVS3P10实时语音编码项目;来自腾讯会议天籁实验室的肖玮负责推进和维护。随后,腾讯提交基于Penguins的候选技术;经过AVS音频组交叉验证后采纳。2024年6月,AVS3P10实时语音编码标准正式完成标准化工作,进入公示阶段。

  谈及Penguins音频编码器成为行业标准后,腾讯本身如何推进商业化的问题,腾讯标准化高级工程师张亚军在接受媒体群访时表示,新一代语音编码推出之后,随着音视频编解码技术的迭代,势必会有新的技术替代原有技术。在互通互联方面,也会涉及到产业链上的企业,比如芯片厂商、终端厂商,包括RTC,互联网APP厂商,一起讨论达成共识,最后才有标准发布。

  “我们致力于通过此项标准扩大并推动整个行业的持续发展,实际上是与产业伙伴们共同成长、协作,共享市场带来的丰硕成果。”张亚军说,对部分合作伙伴来说,如果投入产出成本过高,也可以通过合作方式加速推动产品上市,从而推动整个行业加速实现AVS3P10标准应用起来。

(文章来源:南方都市报)

文章来源:南方都市报 责任编辑:33
原标题:新一代实时语音编码标准即将发布,2G网络也能开线上会议
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500