阿里千问全模态大模型Qwen3.5-Omni上线
上证报中国证券网讯(记者杨翔菲)3月30日,阿里千问宣布全模态大模型Qwen3.5-Omni上线。Qwen3.5-Omni是Qwen最新一代全模态大模型,支持文本、图片、音频、音视频理解。结构上,Qwen3.5-Omni的Thinker与Talker均采用Hybrid-Attention MoE架构。
Qwen3.5-Omni系列包含Plus、Flash、Light三种尺寸的Instruct版本,支持256k长上下文,模型支持超过10小时的音频输入及超过400秒的720P(1FPS)音视频输入。
模型在海量文本、视觉以及超过1亿小时的音视频数据上进行原生多模态预训练,该模型展现出卓越的全模态感知与生成能力。
相比Qwen3-Omni,Qwen3.5-Omni多语言能力大大增强,能够支持113种语种和方言的语音识别和36种语种和方言的语音生成。
目前,用户可通过Offline API和Realtime API进行体验。
(文章来源:上海证券报)