Sora热度未退，Stable Video横空出世！AI视频生成领域狂飙突进！

2024年刚开年，好像各位AI巨头跟商量好了一般，聚在一起放大招。

几天前，美国OpenAI公司发布的AI视频生成模型Sora，引发全球关注。

而就在Sora爆火的这几天，一张OpenAI的创始人阿尔特曼和李一舟，“中美两大AI巨头”的恶搞图在网络疯传……

热度还没下去呢……这两天谷歌又发布了号称全球最强开源大模型Gemma！

就在近期，Stability AI的Stable Video官方正式上线！Stability AI推出了Stable Video并开启了公测，其背后的技术正是Stable Video Diffusion 1.1。令人遗憾的是，由于Sora的发布，Stable Video Diffusion 1.1并未掀起讨论的热潮。

就在昨天Stable Diffusion 3突然发布，显然是不希望被其他竞争对手抢了热点。不仅仅是Stability AI近期有大动作，据小道消息说Midjourney马上也要发布视频以及V7！

图片来源于网络

Prompt: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says “Stable Diffusion 3” made out of colorful energy

01 Stable Diffusion 3

Stability AI最近宣布最新的模型系列—Stable Diffusion 3

Stable Diffusion 3的最大亮点莫过于其采用的Diffusion Transformer架构，这不禁让人联想到OpenAI新发布的文生视频模型Sora也同样基于这一架构，真可谓“英雄所见略同”，验证了“Transformer is all you need”的真理。

事实上，SDXL的技术报告也曾提及Transformer的使用，但当时并未展现出明显优势。然而，开发者们坚信通过精细调整参数并应用更大规模的Transformer，定能取得突破。因此，Stable Diffusion 3采用Transformer架构并非随波逐流，而是有备而来。这也解释了为何之前的SDXL并未命名为SD3，因为SD3注定采用全新架构，独步舞台。

Stable Diffusion 3的模型参数从800M到8B，最大的模型到了8B，最大模型8B，该模型为用户提供丰富可扩展性和质量选项，满足多样化创意需求。这是不是意味着文生图的模型参数量从此都要跃上一个新的台阶了，普通玩家的门槛要高了。

通过融合扩散变压器架构与流量匹配，Stable Diffusion 3展现卓越性能。尽管尚未广泛应用，但现已开放早期预览候补名单。

此预览阶段对于收集反馈、提升模型性能与安全性至关重要，如同前序模型一般。技术报告即将发布，敬请期待。

现在可以加入候补名单了

Stable Diffusion 3申请访问权限地址：https://stability.ai/news/stable-diffusion-3

从官方给的例子看，Stable Diffusion 3的写字能力很强，同时文本prompt的控制更强，很可能也是类似DALLE-3做了训练图像的caption优化。

Stable Diffusion 3的文本控制很强，多主体，文字，位置关系，属性都可以生成的很好，可能不输DALLE-3。

02 Stability Video文本生成视频

Stable Diffusion公司Stability AI也发布了他们最新的AI视频工具Stable video。现在只要你访问这个网站立刻就可以体验了

地址：https://www.stablevideo.com

现在已经支持通过图片跟文字来生成视频内容了，并且还可以调整视频比例，视频风格以及摄像机的运动等等。

每生成一个视频，会耗费10~15个积分点，官方每天会提供150个免费的积分点作为赠送，总体体验下来，Stable video和Sora做视频的功底的确是有差距的。

在这里提醒下大家：除了每日150个赠送积分外，还新增了积分购买选项，目前提供两种积分包（积分永久有效）

500积分/$10，大概50条视频

3000积分/$50，大概300条视频

总的体验下来的感觉，如果之前Sora没有出来之前，我真的还觉得挺不错的，但是我用完Sora之后，单单从效果上来说的话，的确稍微差点意思。还有就是服务器稍微有点不稳定，应该是刚正式开放公测，人多！

尽管SVD1.1取得了显著进步，但与Sora相比，仍存在不少遗憾。具体而言：

SVD 1.1生成的视频片段往往较为短暂，鲜有超过4秒的时长。

该模型在生成过程中容易偏向静态或缓慢移动的图像，难以捕捉瞬息万变的动态场景。

在交互性和控制方面，SVD 1.1目前尚不支持通过文字指令直接驾驭视频内容的创作，其功能多局限于静态图像向视频的转化。

当涉及到文字内容的生成时，特别是在需要清晰、准确呈现文字信息的场合，SVD 1.1往往难以胜任。

在视频中人物占比较小的情况下，SVD 1.1可能难以精确刻画人物的面部细节。

新年伊始，科技领域风起云涌，人工智能领域更是硝烟弥漫，显然今年又将是一个变革与竞争并存的年份。

我们普通人，一定要努力跟上时代，积极拥抱新知，砥砺前行。

AI视频笔记 # AI视频生成

文章版权归作者所有，未经允许请勿转载。

Sora热度未退，Stable Video横空出世！AI视频生成领域狂飙突进！

1分钟学会5个腾讯元宝AI技能，让你的工作效率提高200%

新手指南，3步用DeepSeek生成AI大片，有手就会！

相关文章

国产AI进军动漫界，将你的想象力转化为收入

FunClip：轻松实现直播切片与影视剧精华提取

用AI创作神话视频，狂吸上百万粉丝，轻松成为流量大咖（附教程）

（附提示词）AI入门实战教程，白蛇变身蛇年大吉！

加入收藏夹

设为首页

热门文章

AI版 “小Lin说”？手把手教你用AI打造一个财经类知识博主

相信这10个Midjourney提示词能解决您公司PPT配图的问题

DeepSeek App：国内顶级AI模型免费用，学习办公效率大提升！

不露脸也能火？AI技术重塑短视频创作，健身博主半年涨粉16万+

AI绘画生成工笔画，也太美了吧【附提示词】

100个值得收藏MJ关键词：Cibulak瓷器

Sora热度未退，Stable Video横空出世！AI视频生成领域狂飙突进！

1分钟学会5个腾讯元宝AI技能，让你的工作效率提高200%

新手指南，3步用DeepSeek生成AI大片，有手就会！

相关文章

加入收藏夹

设为首页

热门文章

标签云