三个月九次迭代 快手可灵AI面向全球发布1.5模型
2024年09月20日 14:51
来源: 经济参考网
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈


K图 01024_0

  9月19日,可灵AI迎来重磅升级,视频生成新增可灵1.5模型,在画质质量、动态质量、美学表现、运动合理性以及语义理解等方面均有显著提升。与此同时,可灵AI还引入了全新的“运动笔刷”功能,进一步提升视频生成的精准控制能力。

  首先是基座模型再次升级,新增可灵1.5模型,支持在高品质模式下,直出1080p高清视频,挑战大屏清晰度与质感。与可灵1.0模型相比,1.5模型在画面质量、动态质量、文本响应度等方面有显著效果提升,其内部评测整体效果提升95%。

  此前,可灵1.0模型在高品质模式可生成720p视频,本次升级后,1.5模型高品质模式可直接生成1080p高清视频。通过输入提示词“女孩看着车窗”,对比左右两个版本视频生成的效果,可以发现,可灵1.5新模型的画面质量提升显著:画面清晰度有直观可感,画面右侧的女孩面部细节更清晰丰富,车窗的水雾、整体光影表现等也都更加出色。同时,新模型下画面整体构图也进一步优化,画面更具美感。

  在动态质量方面,新模型也有显著提升。例如,对比可灵AI此前火爆出圈的吃面案例,输入提示词“小男孩吃面”,右侧1.5模型生成的视频中,面条从被夹起到入口这一过程中,在弹性、垂坠感等方面有非常真实的物理表现,同时小男孩右手握住筷子和吃面时的咀嚼动作,也都较左侧1.0模型更加自然流畅,整体运动合理性大大增强。

  在图生视频方面,可灵全新的1.5模型可以响应更复杂的文本描述要求。例如通过一张没有人物的食物照片和提示词“镜头拉远,一个小男孩走到桌前拿起勺子开始吃饭”。在生成的视频中,随着镜头的微微晃动,一个勺子“入场”,然后画面聚焦到握着勺子的小男孩,看他将一勺饭菜送到嘴里,勺子在碗里拨开饭粒的细节也都被细致地呈现了出来,显示出强大的图生视频理解能力。

  本次升级,可灵AI还带来了强大的“运动笔刷”功能,大幅提升了图生视频时创作者对运动效果的控制能力。“运动笔刷”功能支持为图片中的元素(人或物体等)指定运动轨迹,用户只需将图片中需要控制运动方向的部分勾勒出来,然后画一个示意运动方向箭头,就可实现精准运动控制。该功能支持上传图片后最多为图中的6个元素(人或物体等)指定运动轨迹。此外,还可以为某些元素额外指定静止区域,让视频内容有更好的运动控制及运动表现。

  目前,横屏(16:9、4:3)、竖屏(9:16、3:4)、方屏(1:1)等多种尺寸格式的图片,都支持使用「运动笔刷」生成视频,生成视频时长为5秒。大量用户和媒体的评测显示,可灵AI的运动笔刷功能,在易用性、效果表现等方面均为业内领先。

  实际上,可灵AI近期还进行了一系列其他功能升级,诸如支持一次性生成最多4条视频,方便创作者快速选取到最优生成结果;“图生视频”功能新增支持10秒时长并在标准模式下支持增加尾帧;“AI图片”功能支持“画质增强”。此外,官方还上线了使用指南,帮助用户更好地掌控可灵AI。

  自今年6月发布以来,这已经是可灵AI累计第9次迭代升级。本次升级也将同步面向全球展开,今年7月,可灵AI宣布国际版1.0正式上线,正式面向全球用户开放,随后又推出了全球会员体系。目前,可灵AI目前已经累积了大量的国内外用户,快手高级副总裁、主站业务与社区科学线负责人盖坤此前在快手投资者日上披露,已有累计超260万人使用过可灵AI,并累计生成超2700万个视频、5300万张图片。(刘佳)

(文章来源:经济参考网)

文章来源:经济参考网 责任编辑:65
原标题:三个月九次迭代 快手可灵AI面向全球发布1.5模型
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500