传媒行业专题研究:Vidu~国内AI视频生成模型新突破-240509(23页).pdf

编号:161770 PDF 23页 2.59MB 下载积分:VIP专享
下载报告请您先登录!

传媒行业专题研究:Vidu~国内AI视频生成模型新突破-240509(23页).pdf

1、 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。1 证券研究报告 传媒传媒 Vidu-国内国内 AI 视频生成模型新突破视频生成模型新突破 华泰研究华泰研究 传媒传媒 增持增持 (维持维持)研究员 朱珺朱珺 SAC No.S0570520040004 SFC No.BPX711 +(86)10 6321 1166 研究员 吴珺吴珺 SAC No.S0570523100001 +(86)755 8249 2388 行业走势图行业走势图 资料来源:Wind,华泰研究 重点推荐重点推荐 股票名称股票名称 股票代码股票代码 目标价目标价 (当地币种当地币种)投资评级投资评级 昆仑万维 3

2、00418 CH 50.09 买入 捷成股份 300182 CH 6.16 买入 光线传媒 300251 CH 13.60 买入 资料来源:华泰研究预测 2024 年 5 月 09 日中国内地 专题研究专题研究 全球全球 AI 大模型持续迭代,持续看好视频等多模态发展前景大模型持续迭代,持续看好视频等多模态发展前景 今年以来,全球 AI 大模型端都持续迭代升级,包括海外的 Sora、Llama3等,国内的 Kimi、昆仑天工 AI、阶跃星辰等。4 月 27 日,北京生数科技有限公司联合清华大学发布了中国首个长时长、高一致性、高动态性视频大模型 Vidu。行业的发展进度有望不断催化传媒相关板块的

3、发展,我们看好:1)AI 视频大模型依赖多样化训练数据,高质量视频素材库价值凸显;2)AI 大模型助力应用场景发展。我们推荐:昆仑万维、光线传媒、捷成股份、值得买。其他产业链标的包括华策影视、中文在线、中广天择、掌阅科技等。Vidu:国内:国内 AI 视频生成模型新突破视频生成模型新突破 Vidu 采用了团队原创的 Diffusion 与 Transformer 融合的架构 U-ViT,能够一键生成长达 16 秒、分辨率达到 1080P 的高清视频内容,其拥有丰富的想象力,能够模拟真实物理世界,并具备多镜头生成、时空一致性高等特点。核心团队来源于清华大学人工智能团队,首席科学家为清华人工智能研

4、究院副院长朱军。公司的多模态大模型为全栈自研,能够融合文本、图像、3D、视频等多模态信息。除文生视频外,公司在文生图、3D 生成等多模态能力上均有所造诣。Vidu 快速进化,与快速进化,与 Sora 差距不断缩小差距不断缩小 2024 年 1 月,生数团队实现 4 秒视频的生成,已可以达到 Pika、Runway的效果,至 3 月底实现 8 秒视频生成,4 月实现 16 秒视频生成,在 3 个月内生成时长提升至 4 倍,且据 4 月 27 日中关村论坛中生数领军人朱军的发言,Vidu 会以更快的速度迭代,与 Sora 差距将越来越小。Vidu 生成视频的运动幅度较大。除 Sora 外,目前文/

5、图生视频较难做到让人物做出复杂动作,因此为了保证画面畸变最小,视频生成的策略为选择小幅度的运动,较难设计复杂动作,难以处理场景和人物的一致性问题。Vidu 在保证了时空一致性的前提下运动幅度较大。分辨率赶上第一梯队,但仍为固定比例尺寸。Vidu 模型使用模型使用 U-ViT 架构,多模态、效果好、成本低架构,多模态、效果好、成本低 在 U-ViT 前,Diffusion 模型中的主流主干(backbone)一直为基于 CNN 的U-Net。U-ViT 是生数科技团队设计的一种简单通用的、基于 ViT 的架构,使用 Diffusion 生成图像,打响了扩散模型中 CNN 被 Transforme

6、r 取代的第一枪。模型首先对输入图像进行分割处理(分割为 patch),与时间和条件一道表示为 token 后通过 Embedding 层,随后经过 Transformer Block 后输出为 token,并通过一个线性层转为图块,最后通过一个可选的 3X3 卷积层输出为最终结果。此外,U-ViT 成本优势大幅领先,主要得益于 ViT 架构的训练成本较低。风险提示:竞争加剧,模型发展进度低于预期,政策监管风险等。(38)(26)(14)(2)10May-23Sep-23Jan-24May-24(%)传媒沪深300 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。2 传媒传媒 正文

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(传媒行业专题研究:Vidu~国内AI视频生成模型新突破-240509(23页).pdf)为本站 (SIA) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠