实测!可灵AI季度收入1.5亿,最新版本正式发布:物理真实感大幅提升实测可灵2.1可灵一季度创收1.5亿
微资讯
实测!可灵AI季度收入1.5亿,最新版本正式发布:物理真实感大幅提升
闻乐
2025-05-3015:55:37 来源:量子位
克雷西 闻乐 发自 凹非寺
量子位 | 公众号 QbitAI
提质不加价,可灵新版视频生成模型正式登场!
新版本依然是一石激起千层浪,不到24小时就有超过72万次阅读。
我们也带来了新鲜实测!
没有辅助提示词的情况下,2.1版的图生视频相比于前一代1.6普通版,明显内容更加合理了。
△上半部分为2.1新版生成,下半部分为1.6
这一波快手上线了可灵2.1的两个版本,距离上次大更新过了一个多月:
- 2.1普通版:1080/720P,运动更好、细节更到位、更自然、画面更流畅,且主打性价比;
- 2.1大师版:1080P,质量更高,大幅度运动表现更好(价格也更高)。
这也是快手战略调整,成立可灵AI事业部之后,可灵大模型的第一次大更新。
有网友试用之后表示,这就是可灵对Veo3的回应。
模型一片叫好声之余,可灵创造的业绩数据也随着快手最新一季财报新鲜出炉——
今年前三个月,快手靠可灵收入了1.5个亿,超过了去年7月到今年2月可灵的收入总和。
实测可灵2.1
那我们就先来看看超高性价比的2.1普通版,具体又包括了标准的720P和高品质的1080P两种模式。
目前普通版只支持图生视频,文生视频将在之后上线(大师版已支持文生视频)。
这样的顺序背后也有数据作为支持——此前可灵2.0上线时,快手副总裁、可灵AI负责人张迪曾介绍,在使用可灵生成视频的用户当中,有85%使用的是图生视频。
那我们就直接用可灵AI生成的图片来尝试一下。
一只黑白相间的猫追着蝴蝶
图生视频的配套提示词则是这样:
黑白相间的猫轻快地追逐蝴蝶,跑入盛开的花丛中,镜头跟随其动作,花瓣被带动轻轻扬起,阳光明媚的午后
来对比一下2.1普通版的高品质1080P(右)和1.6版本的高品质1080P(左)。
可以看到的是,两个版本对于画面理解的效果都不错,但1.6版本中蝴蝶有两秒像是飘在半空中。
2.1版本中猫的动作更轻快,而且视频中蝴蝶的飞行更灵动,仔细看可以发现,当蝴蝶停在花瓣上时,由于重力的作用,花瓣飘动的幅度更大了,让整个画面有一种“物理真实感”。
看完小猫,再来看一组人物动作细节的对比,首帧图是一个小男孩正在吃手里拿的面包。
这一次图到视频中间不加提示词,直接让模型自由发挥。
1.6版本(下)中,小男孩咬面包的位置和最终面包缺口不太一致,并且咀嚼动作显得“更吃力”。
2.1版本(上)在这两点上没有太大缺点,咀嚼动作更自然。
最细节的是,它保留了小男孩脸上的“小痣”,而这一点被1.6版本(右)的前两秒忽略了!
看完这个单人的细节镜头,再看一组多人物、大场景的例子,还是照例先生成图像:
春节,爷爷奶奶,爸爸妈妈,1个男孩,5个人其乐融融的互相聊天,桌上的菜肴丰富
小男孩站在餐桌旁举起红包向家人展示,爷爷奶奶和爸爸妈妈围坐在摆满菜肴的餐桌前鼓掌微笑,红色的春联在暖黄灯光下微微飘动,五口之家其乐融融地聊天,窗外隐约可见绽放的烟花,固定镜头。
可以看出,“烟花”和“红包”的元素直接被下面的1.6版给忽略了,而2.1则进行了正确复现。
另外在鼓掌的动作上,2.1版本生成的视频看上去也更加真实。
另外,关于可灵2.1大师版,可灵官方也给出了可灵超级创作者的作品作为Demo。
在语义理解上,视频能完整呈现提示词信息,就连虚化的背景都能看出一种动态感。
面部细节更加真实,无论是皮肤状态还是女人说话时面部肌肉的走向,都让人感觉这是能在“真实物理世界”发生的事。