对标Sora 2还免费的国产AI,到底啥水平?

对标Sora 2还免费的国产AI,到底啥水平?

自打有了AI之后,网友手搓电视剧的热情,那是一刻没有消停过。

前脚刚看到《甄嬛传》里“臣妾要告发熹贵妃私通”的名场面,被魔改成了“臣妾要告发大胖橘私通”。

后脚就又刷到了《狂飙》里的高启强,大声喊着《无间道》里“三年之后又三年”的经典台词

还有汉尼拔抱着个头骨问你,到底是要先洗澡,还是先被他享受。。。

那情绪、那口型,要不是差评君阅片无数,差点就信了。

咱不得不承认,现在的AI视频是越来越难辨真假了。

前阵子Sora 2的发布,让圈子再次疯狂,从整个行业趋势来看,大家越来越注重视频的音画同出能力,以及更完整的叙事体验。

这不,就在两天前,Gaga AI 搓了个视频模型 GAGA-1,不卷通用视频,而是另辟蹊径,做出了号称是全球首个专注人物对话的影视级音画同出模型。

对标Sora 2还免费的国产AI,到底啥水平?

像开头那几个视频,就出自GAGA-1之手。

别看Gaga AI这个名字陌生,团队的技术底子可不薄,之前开源过全球首个自回归架构视频模型。

隔壁知危还写过一篇长文,专门介绍过他们。

对标Sora 2还免费的国产AI,到底啥水平?

不过除了 Gaga AI 之外,现在能搞定音画同出的,一只手都数得过来,不外乎就是 Sora 2、Veo 3 等巨头出品的了。

所以差评君也好奇,这个团队搓出来的GAGA-1到底有多神?

正好GAGA-1现在已经免邀请码全量上线了,我们也去测评了一波,先说结论吧:

在让AI演戏条细分赛道上,它的表现,还真不输Sora 2。

打开Gaga AI 的官网,一个prompt输入框就这么怼脸上了。

对标Sora 2还免费的国产AI,到底啥水平?

只需要上传一张人物图片,或者直接让AI生成一张图片,再输入你想要呈现出现的效果,就可以生成一段10s的视频,最高画质720p,目前暂时只支持16:9的格式。

官方说是10s的视频生成时间不超过5分钟,但根据差评君的实际测评,基本上不到2分钟就结束了。

咱们还是先拿《甄嬛传》练练手,借用那句经典的二创台词“窝囊只是我的伪装,娘娘我爱过一双”,让温太医也装上一回。

结果好家伙,Gaga AI还真给他加上戏了,看看这三分挑衅、三分讥笑、四分漫不经心的得意表情,大胖橘的棺材板儿都快压不住了。

温太医那张忠厚老实的脸,硬是扛住了反人设台词的冲击,全程脸没崩,嘴皮子利索得跟原装似的,每个字都对上了。

感觉有了AI以后,《甄嬛传》兑点水还能再看50年。。。

但话又说回来,光念两句台词,就吹GAGA-1牛逼,那就有点硬吹了。毕竟,人家打的可是“影视级音画同出模型”的招牌。

划重点,影视级,这玩意儿可不是简单对口型就完事儿了。真正的影帝影后,眼神、情绪,甚至是脸上的每一块肌肉都在演戏,细节多到变态。

所以咱们也得给Gaga AI上点强度。

《喜剧之王》应该不少差友都看过吧?里面有一段试戏的剧情,星爷一个人演出了好几种紧张。

对标Sora 2还免费的国产AI,到底啥水平?

咱们今天也致敬一下经典,用同一张图片,让它演绎几种不同的情绪。

首先是兴奋、难以置信,配上“我成功了!我真的穿越回国庆前一天了”的台词。

视频里的这哥们头都激动得晃起来了,从难压的嘴角再到控制不住的眼角皱纹,整张脸都在用力表达“卧槽,真的假的?!”

你就说情绪够不够饱满吧,特别是眼神里透出来的光,不像演的,感觉是真穿越回去了。

再来演绎一个,从高兴到失望、难过的情绪变化。

情绪过渡得稍微迟缓了些,不知道是不是差评君的提示词太收敛了,没有想象中那种瞬间垮着个脸的情绪切换。

但也不得不说,Gaga AI让这哥们演出了一种实在没招了的命苦感。

而且台词功底上,也不是死板地照着稿子念,情绪和面部表情的变化,都是在理解台词的基础上进行的。

测到这里,大伙儿心里估计也有数了,Gaga AI不只是一个简单的对口型工具。虽然细节上多多少少还有瑕疵,但就刚才那段从狂喜到无奈的演绎,情绪、眼神,甚至是语气说一句“影视级”,应该不过分吧?

另外,差评君还发现Gaga AI演对手戏也是一绝。

就拿《无间道》里经典的天台对峙那一段,咱们来恶搞一波。

生成的视频里,刘建明和陈永仁顶着两张严肃的脸,聊着偷吃炸鸡这种鸡毛蒜皮的小事儿,诙谐感拉满了。

还有《绿皮书》的这个场景,对话的时候,还给没说话的一方加上了不易察觉的视线移动。

就是吧,搭在肩上的手没被识别到,动作上算是小小翻车了一下。

这还没完,Gaga AI是支持多语种的。我们把《三国演义》里诸葛亮那句出圈的“我从未见过有如此厚颜无耻之人”,换成了英文版。

情绪到位、口型全对,就是唐国强老师这套服化道,配上一股莎翁戏剧腔,硬是演出了一种《哈利波特》的感觉。。。

说来就来,看看把《你的名字》的日语台词,跟哈利的脸结合到一起,能擦出什么样的火花。。

台词一加上,好像还真有点日系忧郁男主那味儿了。

测试下来,差评君觉着Gaga AI在音画同出、理解并演绎复杂情绪,还有处理多角色互动上,确实有两把刷子。

在深度测评之后,我们这次也有些小发现和使用技巧,或许可以给大伙儿做个参考:

1.相比全身照,用胸部往上的半身照片测试效果往往更好。

2.时间文字较少的话,建议生成5s视频,能减少声音和画面崩坏的概率。

3.情绪切换和人物动作,最好是在写prompt的时候表达清楚。

4.相比其他风格,写实风格的人像输出效果更稳定。

总的来说,Gaga AI的出现,也让我们看到AI视频正在从单纯生成画面,慢慢过渡到塑造人物表演的船新版本。

相比于生成华丽、空洞的默片,大家更注重一个有血有肉的人物、一个好故事的完成度。

AI视频往这个方向进化的同时,虽说也带来了一些争议,比如AI演员会不会替代人类演员之类的讨论。

对标Sora 2还免费的国产AI,到底啥水平?

但老实说,现阶段的视频生成技术要想讲好一个故事,还有很多细节上的东西要学,就比如潜台词的理解、表演的节奏,甚至是一个恰到好处的停顿和眼神。

这些东西,并不是单纯堆算力就能堆出来的,需要有专门的模型去针对性学习和优化。

而这或许就是Gaga AI这类应用出现的意义,说不定,未来AI 视频的“iPhone 时刻”,就会由这些小而精的工具共同引爆。

最后再给大伙儿省点事儿,Gaga AI的网址放这了,感兴趣可以试一试:https://gaga.art

撰文:没瓜西

编辑:江江

美编:萱萱

图片、资料来源

Gaga AI

部分图源网络

对标Sora 2还免费的国产AI,到底啥水平?