生数科技近期发布Vidu 1.5版本,新增多图参考功能,解决了视频生成模型的一致性难题,特别是在多主体一致性方面取得突破。
Vidu 1.5作为全球首款攻克人物角色一致性难题的国产大模型。今日,让我们一同探索Vidu1.5的非凡魅力。

这次Vidu 1.5升级了不止多主体一致性的功能,生成时间和质量、语义理解、运动幅度和动漫风格都得到了进一步的增强。

不仅如此,Vidu1.5在视频质量上的追求同样令人瞩目。从细腻的光影渲染到生动的面部表情捕捉,再到复杂文化元素的精准呈现,每一帧都彰显着不再那么一眼AI。
Vidu1.5模型还能够理解多图输入的上下文,提升了视频生成的连贯性和逻辑性。
讲完了这次Vidu 1.5模型的更新,现在给大家实操一下,看看是否是像Vidu官方所说这么好。
Vidu 1.5模型官方使用地址:
https://www.vidu.studio
首先登录上方链接,登入之后可以使用手机号验证码注册或是邮箱登录。


现在就给大家实操一下Vidu 1.5的生成效果,先选好三张参考照片。

输入提示词:精灵男孩手里拿着蛋糕,在水晶场景里,镜头逐渐拉近,镜头顺时针旋转

放入参考图和输入提示词,点击生成按钮,的确如Vidu官方所说,生成时间的确是大概30秒左右就生成好了。

下面是Vidu 1.5模型生成的视频
人、物、景的一致性方面的确保持的非常不错,不论是视频的清晰度还是光影镜头都无可挑剔。
这次我们再选三张参考图试一下

输入提示词:女孩的手心漂浮着一只半透明金鱼,镜头逐渐拉近,镜头顺时针旋转

还是等待30秒左右就生成好了,这次特意选择的物体是会动的,看看效果如何。

Vidu 1.5生成的视频内容真的是没有什么可挑剔的,不仅提升了视频模型的可控性,还通过灵活的多元输入实现了多角度、多主体、多元素的一致性生成。
Vidu1.5的问世,不仅是技术层面的巨大飞跃,更是对创作者想象力与创造力的极大释放。
在此之前是完全不敢想象的,因为不管是视频模型还是绘图模型工具,生成的内容都是充满随机性,完全可以说是在“抽卡”,虽然这些AI工具的确很强大,但用在现实生活中的情况下很少。
不难预见,Vidu1.5在影视行业的应用前景极为广阔,特别是在特效场景的制作上,其潜力尤为显著。
想象一下,仅需简单导入素材图片,便能迅速生成如此逼真、自然的画面场景,这无疑为影视制作开辟了全新的高效路径。
现在Vidu1.5已经在官网全面上线,有兴趣的小伙伴赶紧去试试!