1、大模型方向行业研究报告大模型方向行业研究报告Industry Research Report on Large Model Direction2023大模型方向行业研究报告目录目录一、一、大模型行业概览大模型行业概览.1(一)大模型的起源.1(二)大模型的定义.1(三)大模型的发展历程.2(四)大模型的发展现状.2(五)机遇与挑战.9(六)国内外大模型厂商总览.10二、二、大模型人才现状大模型人才现状.10(一)人才发展现状.11(二)人才发展建议.18三、三、国内主要厂商国内主要厂商.20(一)百度:.20(二)阿里:.22(三)腾讯:.24(四)字节跳动:.25(五)华为:.26(六)百川
2、智能:.27四、四、结语结语.28大模型方向行业研究报告12023.11HyperGrowthManagementConsultingwww.hyper-一、一、大模型行业概览大模型行业概览(一一)大模型的起源大模型的起源大模型的起源可以追溯到2012年。当时,深度学习领域取得了两个重要的突破:AlexNet和GPU的应用。AlexNet是一个包含5000万个参数的深度卷积神经网络,它在ImageNet图像分类竞赛中取得了很好的成绩。同时,GPU 的应用也为大模型的训练提供了强大的计算能力。这两个突破为大模型的快速发展奠定了基础。2017 年,谷歌提出了 Transformer 结构,该结构成
3、为了自然语言处理领域的重要里程碑。Transformer 结构包含亿级别的参数,具有强大的语言理解能力,为自然语言处理领域带来了突破性的进展。随着计算能力的提升和算法的优化,越来越多的公司和机构开始投入到大模型的研究中。2018 年,脸书推出了 Facebook AI 大模型(又称 ERNIE-Health),该模型包含 33 亿个参数,用于医疗健康领域的知识问答任务。2019 年,谷歌推出了 Switch Transformer模型,该模型包含 1.6 万亿个参数,成为了目前最大的 NLP 模型之一。(二二)大模型的大模型的定义定义1.1.大模型的大模型的概念概念大模型是指具有庞大的参数规模
4、庞大的参数规模和复杂程度复杂程度的机器学习模型。在深度学习领域,大模型通常是指具有数百万到数十亿参数的神经网络模型数百万到数十亿参数的神经网络模型。一般来讲,参数量超过 10 亿亿、具备泛化能力泛化能力的模型,可以被称为大模型。图图 1:大模型的概念大模型的概念资料来源:百度:关于大模型的定义,海伯高斯研究团队整理大模型方向行业研究报告22023.11HyperGrowthManagementConsultingwww.hyper-2.2.大模型的特点大模型的特点1)参数规模巨大:大模型可以处理更加复杂、庞大的数据集,从而获得更好的性能。缺点:大量的数据和参数会占用大量的内存空间。2)深度结构
5、复杂:更好地捕捉数据中的复杂模式和特征,从而提高模型的准确性和性能。缺点:更加复杂和细致的计算,提高了时间和计算成本。3)泛化能力(通用能力)强:大模型能够从已有知识中提取普适规律,并将其应用于新的情况和问题上。4)语义理解与生成/自然性:大模型能够更好地处理语言语义,生成更自然、连贯、富有逻辑的文本、图像、音频等内容。(三三)大模型的发展历程大模型的发展历程(四四)大模型的发展现状大模型的发展现状1.1.产业规模产业规模1)市场规模市场规模从 2023 年 3 月开始,国内的 AI 大模型如雨后春笋般涌现。据统计,截至 2023 年 7 月底,中国累计已经有 130 个大模型问世;国外大模型
6、发布数量累计达 138 个。图图 2:大模型发展的时间线大模型发展的时间线资料来源:海伯高斯研究团队整理大模型方向行业研究报告32023.11HyperGrowthManagementConsultingwww.hyper-根据国际数据公司 IDC 预测,全球 AI 计算市场规模将从 2022 年的 788.4 亿人民币增长到 2026 年的 4555.2 亿人民币。其中,生成式 AI 计算市场规模将从 2022 年的60 亿人民币增长到 2026 年的 802.3 亿人民币。而中国庞大的市场需求和丰富的人才储备,为大模型的发展壮大提供了有利的客观条件,据专业机构预测,中国大模型产业市场规模