首个腾讯产品免费!混元文生视频大模型,0成本打造爆款视频

AI视频笔记2个月前发布 彩格AI
2 0
自OpenAI发布文生视频模型Sora已经将近一年了,Sora依旧保持神秘面纱,仅限于少数业内专家的内部测试之中,尚未向广大公众揭开其庐山真面目。

在这段时间,国内的可灵AI、即梦AI、智谱清影、海螺AI、Vidu等视频大模型纷纷来袭,相继亮出了自家的文生视频模型,市场竞争愈发激烈。

就在2024年最后的一月,腾讯混元视频大模型上线文生视频,并宣布开源!全新文生视频功能震撼登场,生成大模型HunYuan-Video向公众开放源代码。

腾讯开源该视频生成大模型,参数量130亿,是当前最大的视频开源模型,一举夺得了当前最大视频开源模型的桂冠,可以说是在开源界当之无愧的T0选手。

首个腾讯产品免费!混元文生视频大模型,0成本打造爆款视频
目前混元大模型的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。生成的单个视频最长时长为5秒,在标准模式下生成一个视频所需时间为120秒。

该模型已上线腾讯元宝APP,用户可在AI应用中的“AI视频”板块申请试用。也可以在网页端中输入手机号登录申请内测。API同步开放测试,开发者可通过腾讯云接入。

首个腾讯产品免费!混元文生视频大模型,0成本打造爆款视频
腾讯混元文生视频地址:

https://video.hunyuan.tencent.com/

腾讯混元文生视频开源地址:

https://github.com/Tencent/HunyuanVideo

先看下官方给的视频生成demo,效果的确不错。

HunYuan-Vieo首个版本主要有4大特色:一是画质偏写实,二是进行大幅度动作时仍具有流畅性,三是能够理解复杂文本以及进行多主体交互;四是支持原生转场,主体保持直出的同时多镜头切换。

超写实画质:模型生成的视频内容具备高清质感、真实感,可用于工业级商业场景例如广告宣传、创意视频生成等商业应用。

提示词:200mm长焦镜头,对准一只停在栏杆上的海鸥。羽毛的纹理清晰可辨,前景的木栏杆温柔虚化。远处的落日和海平面融化成金红色的光影

提示词:一个隐藏的瀑布流入清澈的池塘,周围是高大的树木和绿色植物。阳光穿过树叶,在下面的岩石和水面上形成斑点。逼真,茂密森林中的宁静瀑布,宁静、阳光明媚的日子,中景

高语义一致:用户可以进行细致的刻画,例如生成主体的细节,人物概念的组合等。模型可以准确的表达出文本的内容。

提示词:一位戴着复古飞行护目镜的机械师,半跪在蒸汽朋克风格的工作室里。她棕色卷发挽成发髻,零星的银色发丝闪着金属光泽。深棕色皮质工装背带裤上沾满机油污渍,袖口卷起露出布满齿轮纹身的手臂。特写她正用黄铜工具调试一只机械鸟,齿轮间冒出缕缕蒸汽,工作台上散落着铜管、发条和老式图纸。

运动画面流畅:可生成大幅度的合理运动,运动镜头流畅、符合物理规律,不易出现变形。

提示词:穿着白床单的幽灵面对着镜子。镜子中可以看到幽灵的倒影。幽灵位于布满灰尘的阁楼中,阁楼里有老旧的横梁和被布料遮盖的家具。阁楼的场景映照在镜子中。幽灵在镜子前跳舞。电影氛围,电影打光

原生镜头转换:模型原生具备自动生成多视角同主体的镜头切换画面,增强画面叙事感。

提示词:一个男人在书房对着电脑,敲打键盘,认真地工作,镜头切换到卧室里,暖黄色的灯光下,他的妻子在床边读着故事书,轻柔地拍着孩子的胸口,哄孩子入睡。温馨的氛围。

现在混元大模型现在只支持基础的文生视频功能,其他的功能可能还要再等一等。

腾讯混元相关负责人介绍,在生成某个指定画面上,国内外文生视频模型目前的成功率都不太高,用户需要多次“抽卡”,才能得到一个满意的画面。与相对成熟的文生图相比,文生视频的能力还在比较早期阶段。

现在HunYuan-Vieo现在每日3次免费生成次数,有兴趣的小伙伴可以点击链接申请下内测资格!

© 版权声明

相关文章