投资快报

【天风海外】OpenAI发布Sora 文生视频模型，能力大幅提升，内容创作工作流有望被颠覆

2024-02-19投资快报

【天风海外】OpenAI发布Sora 文生视频模型，能力大幅提升，内容创作工作流有望被颠覆，下一个亿级用户的互联网平台雏形已然出现！

事件：北京时间2月16日凌晨，OpenAI发布Sora文生视频大模型，表示OpenAI正在教AI理解和模拟运动中的物理世界,目标是训练能帮助人们解决需要真实世界交互的问题的模型。Sora可以生成长达一分钟的视频,同时保持视觉质量和遵循用户的提示。Sora能够生成包含多个字符、特定类型运动以及准确的主体和背景细节的复杂场景。该模型不仅理解用户在提示中要求的内容,还理解这些东西在物理世界中的存在方式。模型可以通过文字或者图片生成视频

效果展示可参考：
https://www.bilibili.com/video/BV1kC411s7K6/

我们的观点：

1）OpenAI的Sora文生视频模型效果：远超所有此前文生视频方案，几乎实现了两个代际的提升，接近消费者/工业生产需要。
60S的内容长度远超此前文生视频的10S长度，达到了短视频的爆款长度；极度稳定的长镜头乃至多镜头；丰富稳定的物理交互（不仅可以生成完整流畅的走路和划船，甚至可以生成非常真实的猫踩睡觉的人，船在波涛里旋转的接近物理世界镜头）。

2）我们判断OpenAI的Sora效果远超此前的Diffusion模型的根本原因在于模拟世界物理的能力：OpenAI认为Sora作为Diffusion模型能力提升的很大来自于更多的视频作为训练集以及准确深入的语言理解能力与世界构造能力。OpenAI的白皮书尚未发布，但从研究人员来看，真正研发Sora的人员仅有三人，其它均为支持性工作，我们认为OpenAI Sora能力的大幅提升可能主要来自于三方面：1、Diffusion-Transformer架构
2、可能通过UE5、Unity、Nerf等大量生成合成数据作为训练集 3、大语言模型的能力提升和对世界能力的提升。

3）目前商业化进度：OpenAI尚未公开开放Sora权限，表示Sora目前仅为研究项目的开始，CEO Altman在Twitter邀请留言生成视频展示能力，并表示OpenAI已经在和安全测试机构、电影和视频创作者合作，以改进产品。

4）未来市场展望：两千亿美元的短视频创作生态有望率先被颠覆。我们认为生成式AI在视频创作和世界模型的大踏步进步将实现对视频/3D/游戏等下游应用场景的渗透。在短视频、创作工具、游戏等下游领域，Sora等AI原生产品有望融入工作流，增强用户体验、降低用户使用壁垒、进一步降低创作成本，并极大拓展创作者能力边界。Sora已经踏过创造出爆款内容的时长和品质，意味着一到两年的整个行业的边界即将改变。

作者：大虫91 https://www.bilibili.com/read/cv31357959/ 出处：bilibili

很赞哦！ ()

上一篇
OPENAI首个视频模型Sora效果惊艳，多模态应用有望加速

OPENAI首个视频模型Sora效果惊艳，多模态应用有望加速

元宇宙

元宇宙网

投资快报

【天风海外】OpenAI发布Sora 文生视频模型，能力大幅提升，内容创作工作流有望被颠覆

OPENAI首个视频模型Sora效果惊艳，多模态应用有望加速

相关文章

文章评论