智源发布“百模”评测结果:文生视频模型画质进一步提升 但普遍存在大幅度动作变形等问题
摘要
【智源发布“百模”评测结果:文生视频模型画质进一步提升 但普遍存在大幅度动作变形等问题】北京智源研究院评测发现,文生视频多模态模型,画质进一步提升,动态性更强,镜头语言更丰富,专场更流畅,但普遍存在大幅度动作变形,无法理解物理规律,物体消失、闪现、穿模的情况。
12月19日,北京智源研究院发布并解读国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。北京智源研究院评测发现,文生视频多模态模型,画质进一步提升,动态性更强,镜头语言更丰富,专场更流畅,但普遍存在大幅度动作变形,无法理解物理规律,物体消失、闪现、穿模的情况。评测结果显示,快手可灵1.5(高品质)、字节跳动即梦 P2.0 pro、爱诗科技PixVerse V3、MiniMax 海螺AI、Pika 1.5位列前五。
(文章来源:科创板日报)