报告预览

传媒行业专题研究：Vidu~国内AI视频生成模型新突破-240509（23页）.pdf

编号：161770

PDF 23页 2.59MB 下载积分：VIP专享

下载报告请您先登录！

传媒行业专题研究：Vidu~国内AI视频生成模型新突破-240509（23页）.pdf

1、免责声明和披露以及分析师声明是报告的一部分，请务必一起阅读。1 证券研究报告传媒传媒 Vidu-国内国内 AI 视频生成模型新突破视频生成模型新突破华泰研究华泰研究传媒传媒增持增持 (维持维持)研究员朱珺朱珺 SAC No.S0570520040004 SFC No.BPX711 +(86)10 6321 1166 研究员吴珺吴珺 SAC No.S0570523100001 +(86)755 8249 2388 行业走势图行业走势图资料来源：Wind，华泰研究重点推荐重点推荐股票名称股票名称股票代码股票代码目标价目标价 (当地币种当地币种)投资评级投资评级昆仑万维 3

2、00418 CH 50.09 买入捷成股份 300182 CH 6.16 买入光线传媒 300251 CH 13.60 买入资料来源：华泰研究预测 2024 年 5 月 09 日中国内地专题研究专题研究全球全球 AI 大模型持续迭代，持续看好视频等多模态发展前景大模型持续迭代，持续看好视频等多模态发展前景今年以来，全球 AI 大模型端都持续迭代升级，包括海外的 Sora、Llama3等，国内的 Kimi、昆仑天工 AI、阶跃星辰等。4 月 27 日，北京生数科技有限公司联合清华大学发布了中国首个长时长、高一致性、高动态性视频大模型 Vidu。行业的发展进度有望不断催化传媒相关板块的

3、发展，我们看好：1）AI 视频大模型依赖多样化训练数据，高质量视频素材库价值凸显；2）AI 大模型助力应用场景发展。我们推荐：昆仑万维、光线传媒、捷成股份、值得买。其他产业链标的包括华策影视、中文在线、中广天择、掌阅科技等。Vidu：国内：国内 AI 视频生成模型新突破视频生成模型新突破 Vidu 采用了团队原创的 Diffusion 与 Transformer 融合的架构 U-ViT，能够一键生成长达 16 秒、分辨率达到 1080P 的高清视频内容，其拥有丰富的想象力，能够模拟真实物理世界，并具备多镜头生成、时空一致性高等特点。核心团队来源于清华大学人工智能团队，首席科学家为清华人工智能研

4、究院副院长朱军。公司的多模态大模型为全栈自研，能够融合文本、图像、3D、视频等多模态信息。除文生视频外，公司在文生图、3D 生成等多模态能力上均有所造诣。Vidu 快速进化，与快速进化，与 Sora 差距不断缩小差距不断缩小 2024 年 1 月，生数团队实现 4 秒视频的生成，已可以达到 Pika、Runway的效果，至 3 月底实现 8 秒视频生成，4 月实现 16 秒视频生成，在 3 个月内生成时长提升至 4 倍，且据 4 月 27 日中关村论坛中生数领军人朱军的发言，Vidu 会以更快的速度迭代，与 Sora 差距将越来越小。Vidu 生成视频的运动幅度较大。除 Sora 外，目前文/

5、图生视频较难做到让人物做出复杂动作，因此为了保证画面畸变最小，视频生成的策略为选择小幅度的运动，较难设计复杂动作，难以处理场景和人物的一致性问题。Vidu 在保证了时空一致性的前提下运动幅度较大。分辨率赶上第一梯队，但仍为固定比例尺寸。Vidu 模型使用模型使用 U-ViT 架构，多模态、效果好、成本低架构，多模态、效果好、成本低在 U-ViT 前，Diffusion 模型中的主流主干（backbone）一直为基于 CNN 的U-Net。U-ViT 是生数科技团队设计的一种简单通用的、基于 ViT 的架构，使用 Diffusion 生成图像，打响了扩散模型中 CNN 被 Transforme

6、r 取代的第一枪。模型首先对输入图像进行分割处理（分割为 patch），与时间和条件一道表示为 token 后通过 Embedding 层，随后经过 Transformer Block 后输出为 token，并通过一个线性层转为图块，最后通过一个可选的 3X3 卷积层输出为最终结果。此外，U-ViT 成本优势大幅领先，主要得益于 ViT 架构的训练成本较低。风险提示：竞争加剧，模型发展进度低于预期，政策监管风险等。(38)(26)(14)(2)10May-23Sep-23Jan-24May-24(%)传媒沪深300 免责声明和披露以及分析师声明是报告的一部分，请务必一起阅读。2 传媒传媒正文

友情提示

1、下载报告失败解决办法
2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。
3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

本文（传媒行业专题研究：Vidu~国内AI视频生成模型新突破-240509（23页）.pdf）为本站（SIA）主动上传，三个皮匠报告文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三个皮匠报告文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。