生成一张图片仅需0.1元!智谱联合华为开源首个国产芯片训练的多模态SOTA模型
1月14日,智谱宣布,公司联合华为开源新一代图像生成模型GLM-Image,模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程,是首个在国产芯片上完成全程训练的SOTA多模态模型。
智谱介绍,GLM-Image采用创新的“自回归+扩散解码器”混合架构,实现了图像生成与语言模型的联合,是公司面向以Nano Banana Pro为代表的新一代“认知型生成”技术范式的一次探索。新的技术范式下的模型在海报、PPT、科普图等知识密集型场景及高保真细节呈现上表现惊艳。同时,通过改进Tokenizer策略,GLM-Image能够自适应处理多种分辨率,原生支持从1024×1024到2048×2048尺寸的任意比例图像的生成任务,无需重新训练。
值得一提的是,从早期的数据预处理到最终的大规模预训练,GLM-Image全流程均在昇腾Atlas 800T A2设备上完成,验证了在国产全栈算力底座上训练高性能多模态生成模型的可行性。此外,智谱介绍,API调用模式下,GLM-Image生成一张图片仅需0.1元,速度优化版本也即将更新。
(文章来源:中国证券报·中证金牛座)