1、中国市场大模型落地进展与趋势洞察Jul.2023目录Contents中国市场大模型进展与趋势大模型在企业用户落地进展大模型在科技厂商落地进展中国大模型市场全景地图国产大模型市场机会企业落地大模型路径企业用户对大模型的预期大模型在行业落地进展大模型在企业落地方式大模型对科技厂商的价值大模型在数据分析、营销、办公的落地案例02.03.01.10中国大模型市场全景地图国产大模型市场机会企业落地大模型路径中国大模型市场进展与趋势大模型定义大模型:参数量超过10亿、具备泛化能力的模型,可以被称为大模型。大模型小模型AI建模方法深度学习、自然语言处理、多模态技术机器学习、深度学习、自然语言处理、计算机视觉
2、等参数量参数量规模在10亿以上参数量规模是几万至几百万参数应用场景泛语言类场景(自然语言、编程语言等)、多模态场景(文本、图像、音频、视频)场景更加多样,但生成类场景效果差,不具备多模态泛化能力强,处理多任务效果好弱,处理多任务效果差可解释性弱强训练冷启动成本低任务对齐成本高冷启动成本高任务对齐成本低推理反馈速度慢准确率低反馈速度快准确率高大模型当前以生成类应用为主,多模态是未来重点发展方向生成类应用对话式交互内容生成代码开发虚拟专家智能体决策类应用辅助决策:描述、诊断智能决策:预测、指导多模态应用图像、语音、视频、结构化数据企业用户是从应用视角出发,分成生成类应用、决策类应用和多模态应用。受
3、限于模型能力、应用效果等因素,当前阶段以生成类应用为主。理解生成推理大模型能力对比美国市场,中国市场在模型层和应用层发展迅速通用大模型应层模型层基础层AI芯片高速网络存储向量数据库云平台行业大模型领域大模型企业大模型中间层大模型应用开发工具数据标注工具提示词工程工具金融能源教育出海传媒电商医疗政务客服营销应用开发数据分析MSP运维服务商ISV独软件服务商SI系统集成商任务大模型三大要素,驱动中国“OpenAI”(通用大模型)必定出现国产化:从IT基础设施到上层应用软件的国产化、自主可控需求强烈。银行、大型央国企在内部明确限制员工使用ChatGPT用于内部办公、生产场景,5家银行在1年内有明确采
4、购国产大模型服务的计划。客群特征:以央国企等集团型企业为主的客群,集团层面要进行大模型能力建设,有明确购买/自研通用大模型的需求。本地部署:从数据安全角度出发,银行、大型央国企如果将大模型用于生产,必须要进行本地部署。根据爱分析调研,除了部分企业基于开源自研之外,绝大部分国内企业用户和应用厂商,都在等国产大模型的商业化落地,这是国产大模型最核心的驱动力。本地部署国产化国产化服务支持本地部署市场成熟度、监管要求、数据安全等因素推动行业/领域大模型发展监管要求:C端应用短期不会放开,更多应用场景在B端。数据安全:大型甲方企业数据安全考虑,特定场景的SFT数据获取存在一定难度。FT数据量不大,但需要
5、有很深的行业know-how,获取难度不低。通用大模型优先训练通用场景FT数据,特定场景积累需要时间。市场成熟度:很多甲方企业在23-24年有明确上线大模型需求,当前国产通用大模型能力不足。服务支持:中国企业客户需要端到端服务,倾向于采购行业大模型+业务应用,几乎不可能直接采购通用大模型,需要有很强的区域服务支持能力。监管要求市场成熟度数据安全服务支持大模型能力建设和应用场景探索是当前企业用户落地大模型的主要路径基础设施建设芯片(算力)大模型训练模型选型模型训练与微调大模型应用模型压缩大模型与小模型结合集团企业重点是大模型能力建设,一般企业/部门重点是应用场景探索。大模型能力建设分成三个层面:
6、基础设施建设、大模型训练和大模型应用,当前以基础设施建设和大模型训练为主。综合成本和安全性考虑,智算中心会成为解决算力问题的重要方式自建集群成本高AI团队要求高安全性高云服务租用性价比高安全性差智算中心成本低于云服务安全性强安全性投入产出比智算中心云服务租用自建集群当前以SFT为主,未来预训练会成为主流SFT预训练投入算力成本低算力成本高团队需要具备模型训练经验数据集SFT精标数据SFT精标数据大量无标注数据集模型能力受限于模型本身能力能力增强,但可能出现灾难性遗忘安全性受限于模型自身数据集,只能尽可能弥补安全问题很大程度上解决安全性问题未来发展迁移成本低受限于基础大模型,迁移成本高SFT试错