腾讯数字人合作招募

元宇宙网

您现在的位置是:首页 > 全球快讯 > 投资快报

投资快报

AI关键词“OpenAI入局算力、Sora与RTX-AI”

2024-02-19投资快报
春节期间,全球AI热点涌现,利好频出。OpenAI带头执行AI芯片投资计划并发布文生视频新品Sora,英伟达正式发布此前已经有所展示的AI本地部署RAG工具Chat with RTX,谷歌更新Gemini至

春节期间,全球AI热点涌现,利好频出。OpenAI带头执行AI芯片投资计划并发布文生视频新品Sora,英伟达正式发布此前已经有所展示的AI本地部署RAG工具Chat with RTX,谷歌更新Gemini至1.5版本。

OpenAI宏伟投资计划,剑指改革全球半导体。据华尔街日报消息,OpenAI正在打造全球芯片供应链,来彻底重塑全球半导体行业,Altman一直在关注AI芯片的供需问题,2018年,Altman个人投资了一家AI芯片初创公司Rain Neuromorphics,2019年,OpenAI花费5100万美元购买Rain的芯片;去年11月,Altman为一家代号为“Tigris”的芯片企业寻求数十亿美元的资金。我们认为,从远期来看,算力需求或持续超出我们的想象,如果仅依靠台积电的先进制程产能进行供应,或难以满足未来AI用户持续增长带来的供应缺口,而另起炉灶,构建一套由OpenAI自己领导的算力产业链,当下来看是OpenAI切入基础设施领域的可行方案。

文生视频大模型Sora横空出世,其能够理解并呈现物理定律,影视动画行业的颠覆性时刻到来。Sora虽然仍旧使用Transformer架构和基于扩散模型,但最大变化在于其能够在生成的视频中展现出火焰反光、物体运动惯性等自然界规律;同时相较于其他扩散模型,视频可以保持相当高的稳定性和一致性,因此,Sora呈现的AI视频给用户一种连续性强、符合逻辑、具有一定观赏性的感觉。最重要的是,Sora依旧符合AI缩尺律(Scaling Law),OpenAI在技术文档中说明,随着训练计算量的增加,样本质量明显提高,进一步佐证了多模态时代,算力需求将成为最核心的瓶颈之一。

Gemini 1.5将实现大模型最大的上下文窗口。相较于Gemini 1.0,1.5最主要的改进是处理大文件的能力,Gemini 1.5 Pro每次可以处理100万个token,结合原生多模态能力,其可以一次性处理大量信息,例如1小时的视频、11小时的音频、超过3万行(或70万个单词)的代码。Gemini基于MoE(Mixture-of-Experts)专家网络,根据给定的输入,MoE模型将选择性地激活其神经网络中最相关的专家路径,从而极大提高模型效率。

Chat with RTX——AI助理的一小步,边缘推理的一大步。该工具可以使用Mistral、Llama 2等开源模型,帮助用户阅读文档/视频并通过检索增强生成(RAG)总结文件内容,全程由本地RTX显卡进行推理。我们认为,边缘推理是AI触及广大潜在用户的“毛细血管”,世界经济论坛在最近的一份报告中预测,能够离线运行生成式AI模型的设备将“大幅增长”,其中包括个人电脑、智能手机、物联网设备等,原因在于,本地模型不仅更加私密,而且与云托管模型相比,本地模型的延迟更低,成本效益更高。

总结来看,近期的AI行业新闻,在模型层面各家激战正酣,同时在Scaling Law不断应验的事实下,我们此前对算力需求充分乐观的观点将持续被验证,AI算力有望继2023年后,继续成为新一年的热门投资方向。 2月22日(下周四)早6:00英伟达将公布上季度财报,建议密切关注。 算力——

光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、光库科技、光迅科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。

算力调优/调度/租赁:恒为科技、思特奇、中科金财、东方材料、博睿数据、中贝通信、中科曙光、中国移动、中国联通、中国电信。算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪。液冷:英维克、申菱环境、高澜股份、佳力图。边缘算力承载平台:美格智能、广和通、移远通信。卫星通信:中国卫通、中国卫星、震有科技、华力创通、电科芯片、海格通信。

数据要素——

运营商:中国电信、中国移动、中国联通。数据可视化:浩瀚深度、恒为科技、中新赛克。BOSS系统:亚信科技、天源迪科、东方国信。

风险提示:AI发展不及预期,算力需求不及预期,市场竞争风险。

本文源自:券商研报精选

作者:国盛证券

文章评论