奇富科技发布方言技术新进展
本报讯 (记者李冰)日前,奇富科技发布方言技术新进展,其智能语音团队论文《Qifusion-Net:基于特征融合的流式/非流式端到端语音识别框架》被全球语音与声学顶级会议INTERSPEECH 2024收录。这是继去年《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》论文之后的又一国际认可。
同时,奇富科技官宣全自研Qifusion框架模型情况。在复杂的通话环境中,语音识别综合准确率达到了93%以上,意图识别准确率超过95%。据介绍,相较于其他语音识别框架,Qifusion框架模型具有以下特点,方言种类更丰富;方言识别更精准;方言识别更高效。比如,Qifusion框架采用了创新的层自适应融合结构,能通过共享信息编码模块,更高效的提取方言信息。同时,该框架模型还支持即说即译功能,能在无需知晓额外方言信息的前提下,对不同方言口音的音频进行实时解码,实现精准的识别和转译。这使得Qifusion框架在业务场景中能够迅速准确地捕捉并响应用户需求。
(文章来源:证券日报)