响应上海AI应用赋能 商汤Seko 2.0助力“一人剧组”
当下AI漫剧、短剧赛道呈爆发式增长态势。但目前,市面上大部分AI视频生成产品仅支持单集短片或片段素材生产。12月15日起,商汤科技正式启动产品发布周,多款兼具开创性与实用性的AI产品将陆续亮相。当日首发的核心产品Seko2.0,作为行业首个创编一体、多剧集生成智能体,助力“一人剧组”成为现实。
“多剧集、跨分镜的角色一致性一直是行业难点。”商汤科技董事长兼CEO徐立表示,SekoIDX通过在扩散模型的高噪阶段引入“负参考图”,既保证角色在多剧集、跨分镜中的一致性,又避免内容与参考图过度相似,同时在响应不同表情、姿态、场景等指令时依然能保持高度稳定。
底层技术的突破直接转化为生产力的飞跃。传统工作流中一支团队完成50集作品通常需要3个月以上,如今借助Seko 2.0,漫剧制作周期可缩短80%至90%。
此外,AI短剧、漫剧多剧集创作存在token需求量大、成本居高不下的痛点,一个5秒视频就需近10万token,10—20个分镜的总token需求更是高达百万量级。
对此,商汤通过两大核心技术突破破解成本难题:一是创新Phased DMD蒸馏技术,采用分阶段蒸馏结合专家混合模型的架构,让不同模型专精生成流程各环节,实现效率提升与推理成本零增加;二是开源行业首个实时视频生成推理框架LightX2V,依托DiT蒸馏加速、轻量化VAE等优化,在消费级显卡上不到5秒即可生成5秒视频,效率远超同类产品,累计下载量超350万次。目前,LightX2V已完成寒武纪、沐曦等国产芯片适配,实现全国产化部署。
(文章来源:国际金融报)