获得2023年度国家科学技术奖一等奖后仅三天,6月27日,科大讯飞在北京发布讯飞星火大模型V4.0。而仅仅两个月前,讯飞星火大模型V3.5刚刚完成迭代。
作为首个全国产算力训练、完全自主知识产权的大模型,讯飞星火在“百模大战”中始终保持在第一梯队,并且对标全球巨头OpenAI,迎头追赶。
据加州大学伯克利分校等国际权威机构测评,讯飞星火V4.0文本生成、语言理解、多模态等7个核心能力全面提升,整体超越GPT-4 Turbo,在国内大模型中处于领先地位。
据了解,讯飞星火V4.0在图文识别能力上进一步升级,在科研、金融、医疗、司法、办公等场景的应用效果已领先GPT-4。此外,长文本能力也全新升级,并针对长文档知识问答的幻觉问题,业界首发溯源功能。
此前发布的讯飞星火大模型V3.5,是业界首个支持长文本、长图文、长语音的大模型,如今再次迎来新突破。
近期科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目,获得国家科学技术进步奖一等奖。
科大讯飞董事长刘庆峰认为,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪声、多人说话、多语言,因此万物互联时代的AIUI(人工智能用户界面)要满足远场高噪声、多语言多方言、全双工、多模态等标准。
面向万物互联时代,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAI whisper-V3,37个方言识别效果平均提升30%。
针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写,即使在三人混叠说话场景也能实现86%的语音识别准确率。
在发布会现场,三位讯飞研究院的研究员实测了在噪音场景下,同时混叠着说话,讯飞星火的多模态能力实现了三人重叠语音的角色分离,还能实时转写出每个人说的话。
为了让大模型更好落地,科大讯飞正式发布机器人超脑平台2.0,目前已有400多家机器人企业采用该平台。
如何更好地解决企业大模型应用的最后一公里问题?刘庆峰谈到,企业首先要科学地认识大模型能力的边界,根据任务难度选择合适方案,并且用更少的算力、更高的效率,打造企业专属大模型。
今年1月30日讯飞星火V3.5发布以来,短短5个月,星火开发者生态加速增长,开发者数从598万增长到了702万。
刘庆峰表示,只有自主可控的繁荣生态,才有中国通用人工智能的大未来。要科学理性地认识中美在大模型上的综合差距,也要有信心快速追赶。
(文章来源:潮新闻)