1、 1/34 2023 年年 4 月月 21 日日 行业行业|深度深度|研究报告研究报告 行业研究报告 慧博智能投研 AI大模型行业深度:大模型行业深度:行业概述、发展现状、行业概述、发展现状、产业链及相关公司深度梳理产业链及相关公司深度梳理 随着深度神经网络的兴起,人工智能进入统计分类深度模型时代,这种模型比以往的模型更加泛化,可以通过提取不同特征值应用于不同场景。但在 2018 年-2019 年,双下降现象的发现打破了原有的人工智能发展格局。简而言之,以往的数学理论表明,随着参数增多、模型增大,过拟合导致模型的误差会先下降后上升,这使得找到精度最高误差最小的点成为模型调整的目标。而随着人工智
2、能算法算力的不断发展,研究者发现如果继续不设上限的增大模型,模型误差会在升高后第二次降低,并且误差下降会随着模型的不断增大而降低,通俗而言模型越大,准确率越高。因此人工智能发展进入了大模型时代。下面我们将主要介绍 AI 大模型的概念概念、优势优势与技术路线技术路线等内容,并针对大模型大模型产业链产业链及国内外相关企国内外相关企业发布的大模型业发布的大模型进行梳理,探讨未来竞争格局,希望对大家了解 AI 大模型有所启发。目录目录 一、行业概述.2 二、大模型方向.5 三、国内 AI 大模型发展现状及趋势.7 四、国外大模型.9 五、国内大模型.18 六、产业链分析.28 七、格局展望.34 八、
3、参考研报.34 2/34 2023 年年 4 月月 21 日日 行业行业|深度深度|研究报告研究报告 一、行业概述一、行业概述 1、概念、概念 AI 模型最初是针对特定应用场景需求进行训练(即小模型)。小模型的通用性差,换到另一个应用场景中可能并不适用,需要重新训练,这牵涉到很多调参、调优的工作及成本。同时,由于模型训练需要大规模的标注数据,在某些应用场景的数据量少,训练出来的模型精度不理想的情况,这使得 AI 研发成本高,效率低的情况。随着数据,算力及算法的提升,AI 技术也有了变化,从过去的小模型到大模型的兴起。大模型就是Foundation Model(基础模型),指通过在大规模宽泛的数
4、据上进行训练后能适应一系列下游任务的模型。大模型兼具“大规模”和“预训练”两种属性,面向实际任务建模前需在海量通用数据上进行预先训练,能大幅提升人工智能的泛化性、通用性、实用性,是人工智能迈向通用智能的里程碑技术。大模型的本质依旧是基于统计学的语言模型,大模型的本质依旧是基于统计学的语言模型,“突现能力突现能力”赋予其强大的推理能力。赋予其强大的推理能力。通俗来讲,大模型的工作就是对词语进行概率分布的建模,利用已经说过的话预测下一个词出现的分布概率,而并不是人类意义上的“理解”。较过往统计模型不同的是,“突现能力”使得大模型拥有类似人类的复杂推理和知识推理能力,这代表更强的零样本学习能力、更强
5、的泛化能力。2、大模型具备的优势、大模型具备的优势 3/34 2023 年年 4 月月 21 日日 行业行业|深度深度|研究报告研究报告 相比传统相比传统 AI 模型,大模型的优势体现在于:模型,大模型的优势体现在于:(1)解决解决 AI 过于碎片化和多样化的问题,极大提高模型的泛用性过于碎片化和多样化的问题,极大提高模型的泛用性 应对不同场景时,AI 模型往往需要进行针对化的开发、调参、优化、迭代,需要耗费大量的人力成本,导致了 AI 手工作坊化。大模型采用“预训练+下游任务微调”的方式,首先从大量标记或者未标记的数据中捕获信息,将信息存储到大量的参数中,再进行微调,极大提高模型的泛用性。(
6、2)具备自监督学习功能,降低训练研发成本具备自监督学习功能,降低训练研发成本 大模型具备自监督学习功能。可以将自监督学习功能表观理解为降低对数据标注的依赖,大量无标记数据能够被直接应用。这样一来,一方面降低人工成本,另一方面,使得小样本训练成为可能。(3)摆脱结构变革桎梏,打开模型精度上限摆脱结构变革桎梏,打开模型精度上限 过去想要提升模型精度,主要依赖网络在结构上的变革。随着神经网络结构设计技术逐渐成熟并开始趋同,想要通过优化神经网络结构从而打破精度局限变得困难。而研究证明,更大的数据规模确实提高了模型的精度上限。3、大模型技术路线大模型技术路线 大型语言模型研究的发展有三条技术路线:大型语