腾讯数字人合作招募

元宇宙网

您现在的位置是:首页 > 全球快讯 > 投资快报

投资快报

【天风海外】OpenAI发布Sora 文生视频模型,能力大幅提升,内容创作工作流有望被颠覆

2024-02-19投资快报
【天风海外】OpenAI发布Sora 文生视频模型,能力大幅提升,内容创作工作流有望被颠覆
【天风海外】OpenAI发布Sora 文生视频模型,能力大幅提升,内容创作工作流有望被颠覆,下一个亿级用户的互联网平台雏形已然出现!

事件:北京时间2月16日凌晨,OpenAI发布Sora文生视频大模型,表示OpenAI正在教AI理解和模拟运动中的物理世界,目标是训练能帮助人们解决需要真实世界交互的问题的模型。Sora可以生成长达一分钟的视频,同时保持视觉质量和遵循用户的提示。Sora能够生成包含多个字符、特定类型运动以及准确的主体和背景细节的复杂场景。该模型不仅理解用户在提示中要求的内容,还理解这些东西在物理世界中的存在方式。模型可以通过文字或者图片生成视频

效果展示可参考:
https://www.bilibili.com/video/BV1kC411s7K6/

我们的观点:

1)OpenAI的Sora文生视频模型效果:远超所有此前文生视频方案,几乎实现了两个代际的提升,接近消费者/工业生产需要。
60S的内容长度远超此前文生视频的10S长度,达到了短视频的爆款长度;极度稳定的长镜头乃至多镜头;丰富稳定的物理交互(不仅可以生成完整流畅的走路和划船,甚至可以生成非常真实的猫踩睡觉的人,船在波涛里旋转的接近物理世界镜头)。

2)我们判断OpenAI的Sora效果远超此前的Diffusion模型的根本原因在于模拟世界物理的能力:OpenAI认为Sora作为Diffusion模型能力提升的很大来自于更多的 视频作为训练集以及准确深入的语言理解能力与世界构造能力。OpenAI的白皮书尚未发布,但从研究人员来看,真正研发Sora的人员仅有三人,其它均为支持性工作,我们认为OpenAI Sora能力的大幅提升可能主要来自于三方面:1、Diffusion-Transformer架构
2、可能通过UE5、Unity、Nerf等大量生成合成数据作为训练集 3、大语言模型的能力提升和对世界能力的提升。

3)目前商业化进度:OpenAI尚未公开开放Sora权限,表示Sora目前仅为研究项目的开始,CEO Altman在Twitter邀请留言生成视频展示能力,并表示OpenAI已经在和安全测试机构、电影和视频创作者合作,以改进产品。

4)未来市场展望:两千亿美元的短视频创作生态有望率先被颠覆。我们认为生成式AI在视频创作和世界模型的大踏步进步将实现对视频/3D/游戏等下游应用场景的渗透。在短视频、创作工具、游戏等下游领域,Sora等AI原生产品有望融入工作流,增强用户体验、降低用户使用壁垒、进一步降低创作成本,并极大拓展创作者能力边界。Sora已经踏过创造出爆款内容的时长和品质,意味着一到两年的整个行业的边界即将改变。

 作者:大虫91 https://www.bilibili.com/read/cv31357959/ 出处:bilibili

文章评论