通义万相发布视频生成模型 可一键创作影视级高清视频
2024年09月19日 19:25
来源: 上游新闻
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

K图 BABA_0]

K图 09988_0]

  9月19日,在杭州云栖大会上,阿里云CTO周靖人宣布通义万相全面升级,并发布全新视频生成模型,可生成影视级高清视频,可应用于影视创作、动画设计、广告设计等领域。即日起,所有用户可通过通义APP及通义万相官网免费体验。

  据介绍,通义万相首批上线文生视频、图生视频功能,在文生视频功能中,用户输入任意文字提示词,即可生成一段高清视频,支持中英文多语言输入,并可以通过灵感扩写功能智能丰富视频内容表现力,支持16:9、9:16等多种比例生成;在图生视频功能中,支持用户将任意图片转化为动态视频,按照上传的图像比例或预设比例进行生成,同时可以通过提示词来控制视频运动。

  现场,阿里云演示了该模型强大的运动生成和概念组合能力,输入「穿着滑冰鞋的小兔子在冰面上灵活移动的可爱场景」,通义万相仅用数分钟就能生成一段高清、逼真的视频。

  通义万相视频生成大模型集成了多项创新技术,有效解决画面表现力和大幅度运动等视频生成技术难题。针对运动生成和物理模拟等难点优化算法,实现了大幅度主体运动和运镜控制,并有效模拟真实世界物理特性;设计了高压缩比、高质量视频VAE框架,有效降低视频信息冗余,并保持高质量视频重构能力;同时,基于轻量微调框架和精选数据集优化训练,在中式传统元素、风格化视频生成上表现更好。

  去年7月,通义万相图像生成大模型首次亮相,目前已累计生成7500万张图片。云栖大会现场,通义万相宣布视觉生成大模型全面升级为Diffusion Transformer框架,同时结合通义千问复杂提示词解释能力,有效提升画面表现力、语义理解能力、可控生成能力。随着通义万相视频生成模型的发布,通义大模型已覆盖文本生成、图像理解、视频理解、音频理解、图像生成、视频生成等全模态场景。

(文章来源:上游新闻)

文章来源:上游新闻 责任编辑:73
原标题:通义万相发布视频生成模型,可一键创作影视级高清视频
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500