阶跃星辰Step-1o Vision多模态理解大模型上线
上证报中国证券网讯(记者孙小程)1月21日,阶跃星辰宣布上线Step-1o Vision多模态理解大模型。同时,Step-1o Audio语音模型能力迎来升级。Step-1o系列是阶跃星辰最新研发的原生端到端文本、视觉、语音三模态生成理解一体化模型,Step-1o Audio是1o家族的首个模型。
据介绍,此次发布的Step-1o Vision是Step-1o多模态系列模型的视觉版本。相比Step-1V和Step-1.5V视觉理解模型,Step-1o Vision实现了架构升级,在视觉感知和识别、指令跟随、空间理解与推理等视觉任务效果方面实现了大幅提升。
1月20日,LMSYS Org发布大模型竞技场Chatbot Arena最新榜单,Step-1o Vision位列视觉领域中国大模型第一。
与此同时,Step-1o Audio迎来多项提升,在情绪感知与理解、多语种和多方言、通话体验上有了新的突破。Step-1o Audio能够精准识别用户语气、语调中蕴含的情绪信息,并结合语境,深度理解用户的情感需求。
(文章来源:上海证券报·中国证券网)