1、2023 年深度行业分析研究报告 目录目录 摘要.1 一、大模型发展情况.1 1、行业发展历程.1 2、大语言模型概览.3 3、产业发展趋势.6 二、互联网大厂模型.8 1、阿里.8 1.1 模型.8 1.2 算力.12 1.3 平台.14 1.4 应用.15 2、百度.17 2.1 模型.18 2.2 算力.34 2.3 平台.36 2.4 应用.39 3、腾讯.42 3.1 模型.42 3.2 算力.44 3.3 平台.45 3.4 应用.47 4、字节.51 4.1 模型.51 4.2 算力.52 4.3 平台.53 4.4 应用.54 三、商业模式.56 1、API 模式.56 2、P
2、aaS 模式.57 3、MaaS 模式.59 图目录 图 1:语言模型发展时间线.2 图 2:ChatGPT 发展时间线.3 图 3:大模型发展时间线.4 图 4:国产大模型发展时间表.5 图 5:AIGC 模型十大开发机构.6 图 6:预训练语言模型参数量.6 图 7:训练大模型“预训练+精调”模式.6 图 8:通义大模型架构.9 图 9:通义 M6 发展历史.9 图 10:M6-OFA 模型-任务完成模式(架构统一).10 图 11:M6-OFA 模型-预训练模式(模态统一).10 图 12:通义-AliceMind 发展历程.10 图 13:通义-AliceMind 在 CLUE 榜单中
3、名列前茅.11 图 14:通义-视觉框架.11 图 15:飞天智算平台.12 图 16:S4 框架.14 图 17:魔塔社区特点.15 图 18:阿里所有产品将接入大模型升级.16 图 19:百度 AI 大底座.17 图 20:文心大模型全景图.18 图 21:文心基础大模型组成.18 图 22:文心 NLP 大模型发展历程.20 图 23:从大规模知识图谱和海量无结构数据中学习.21 图 24:融合自编码和自回归结构.21 图 25:基于飞桨 4D 混合并行技术进行高效训练.22 图 26:层次化提示(Prompt)学习技术.23 图 27:文心 PLATO 技术研发框架.23 图 28:P
4、LATO 基于隐变量的生成式开放域对话大模型.24 图 29:PLATO 提出隐变量建模 Context 和 Response 的映射信息来解决一对多问题.25 图 30:PLATO-2 引入两阶段训练.25 图 31:PLATO-X 引入 role embedding 感知用户角色.26 图 32:UFO 架构.26 图 33:UFO 多任务联合优化.27 图 34:网络稀疏化(Path Routing).28 图 35:多规模网络学习(Stochastic Architecture Slimming).29 图 36:VIMER-UFO 2.0 单模型 28 个公开测试集 SOTA.29
5、图 37:VIMER-StrucTexT 2.0 文档图像表征学习.30 图 38:商品搜索中多模态信息存在信息缺失问题.31 图 39:商品搜索中多模态信息存在信息缺失问题.31 图 40:基于 VIMER-UMS 的多模态商品搜索.32 图 41:ERNIE-ViL 架构图.33 图 42:ERNIE-ViL 融合场景进行判断.33 图 43:文心 ERNIE-ViLG 2.0 架构图.34 图 44:文心 ERNIE-ViLG 2.0 生成图示例.34 图 45:文心 ERNIE-ViLG 2.0 应用场景.34 图 46:昆仑芯发展历程.35 图 47:昆仑芯产品迭代.35 图 48:
6、飞桨平台全景图.36 图 49:飞桨四大领先技术.37 图 50:飞桨主流模型概览.37 图 51:飞桨硬件生态.38 图 52:飞桨产业实践范例库.38 图 53:飞桨位列中国深度学习市场应用规模第一.39 图 54:飞桨在各指标位列榜首.39 图 55:百度全新 AI 搜索体系.40 图 56:百度文心行业大模型全景.41 图 57:文心大模型产品矩阵.42 图 58:腾讯混元 AI 大模型架构.43 图 59:HCC 大幅提速大模型训练.44 图 60:星星海自研服务器.44 图 61:网络集群算力.45 图 62:HCC 存储架构.45 图 63:太极机器学习平台架构.46 图 64: