Sora深度:功能优势、发展现状、算力测算、相关影响及相关公司深度梳理-240226(27页).pdf

编号:154804 PDF  DOCX 27页 4.35MB 下载积分:VIP专享
下载报告请您先登录!

Sora深度:功能优势、发展现状、算力测算、相关影响及相关公司深度梳理-240226(27页).pdf

1、 1/27 2024 年年 2 月月 26 日日 行业行业|深度深度|研究报告研究报告 行业研究报告 慧博智能投研 Sora 深度:深度:功能优势功能优势、发展现状、算力测算、发展现状、算力测算、相关影响相关影响及及相关公司相关公司深度梳理深度梳理 2024 年 2 月 16 日,OpenAI 发布首个视频生成模型 Sora。Sora 继承 DALL E3 的画质和遵循指令能力,能生成长达 1 分钟的高清视频。Sora 的出现对 AI 行业的发展具有里程碑意义。从中短期看 Sora 作为一款具有强劲性能的视频生成模型,将提升视频生成的质量和效率,对影视和游戏等相关行业具有变革作用;从长期看 S

2、ora 有望成为一款世界模拟器的视频生成模型,为未来发展理解和模拟真实世界的模型奠定基础。围绕 Sora,下面我们从其实现功能、技术路径、算法实现等基本信息入手,了解 Sora 功能优势及局限;梳理文本视频大模型发展历程及当前代表性文生模型并与其对比,对 Sora 进行算力预估并对其未来发展影响进行展望,方便读者深入了解这一大模型。目录目录 一、Sora 概述.1 二、Sora 功能优势及局限.6 三、文生视频大模型发展现状.13 四、代表性文生视频模型梳理及比较.15 五、Sora 对算力网络需求拉动测算.17 六、Sora 将如何改变传媒各细分赛道.19 七、相关公司.20 八、参考研报.

3、27 一、一、Sora 概述概述 1.OpenAI 发布首个视频生成模型发布首个视频生成模型 Sora 2 月 16 日,OpenAI 发布了推出了一款能根据文字指令即时生成短视频的模型,命名为 Sora。2/27 2024 年年 2 月月 26 日日 行业行业|深度深度|研究报告研究报告 根据介绍,Sora 使用扩散模型技术,完美继承了 DALL E3 的画质和遵循指令能力,能够从文本说明中生成长达 60 秒的视频,并能够提供具有多个角色、特定类型的动作和详细背景细节的场景。借助 GPT的能力,Sora 能够实现对语言的深入理解,使其能够准确地解释提示词,并生成引人注目的字符来表达充满活力的

4、情感。Sora 还能在一个生成的视频中创建多个镜头,体现人物和视觉风格。2.实现实现功能功能 RU1WZZDXTUEYTV8OdN9PpNrRsQtPfQqQsQlOoMpQaQpOqQuOpOuMNZrNnR 3/27 2024 年年 2 月月 26 日日 行业行业|深度深度|研究报告研究报告 OpenAI 表示,通过让模型一次生成多帧画面,Sora 解决了一个具有挑战性的问题,即:即使生成的主体暂时离开视线内,也能确保主体不变。除文生视频外,Sora 还具有更多功能:1)根据图像生成动画;2)在时间上向前或向后扩展视频;3)编辑输入的视频;4)在两个输入视频之间逐渐进行插值,从而在具有完全

5、不同主题和场景构成的视频之间创建无缝过渡;5)根据文字生成图像。3.技术路径技术路径 Sora 取法 Tokens 文本特征标记,是基于 Patches 视觉特征标记的 Diffusion Transformer 模型。OpenAI 研究团队从 LLM 中汲取灵感,认为 LLM 范式的成功在一定程度上得益于 Tokens 的使用,Tokens 统一了代码、数学和各种自然语言的文本模式。类似于 LLM 范式下的 Tokens 文本标记,Sora创新性地使用了 Patches(apart of something marked out from the rest by a particular c

6、haracteristic;视觉特征标记)。鉴于 Patches 之前已被证明是视觉数据模型的有效表示,OpenAI 研究团队进一步研发发现 Patches 是一种高度可扩展且有效的表示,可以被用于在不同类型的视频和图像上训练生成模型:4/27 2024 年年 2 月月 26 日日 行业行业|深度深度|研究报告研究报告 5/27 2024 年年 2 月月 26 日日 行业行业|深度深度|研究报告研究报告(1)将视觉数据转化为将视觉数据转化为 Patches(Turning visual data into patches)将视频、图像等视觉数据压缩至低维的潜在空间中,并将其分解为带有时空(Sp

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(Sora深度:功能优势、发展现状、算力测算、相关影响及相关公司深度梳理-240226(27页).pdf)为本站 (蓝色烟花) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠