1、 IT 服务/行业深度分析报告/2023.10.30 请阅读最后一页的重要声明!场景场景应用应用驱动,驱动,AI 预训练预训练数据服务需求有望数据服务需求有望高增高增 证券研究报告 投资评级投资评级:看好看好(首次首次)最近 12 月市场表现 分析师分析师 程兵 SAC 证书编号:S0160523060001 分析师分析师 杨烨 SAC 证书编号:S0160522050001 相关报告 核心观点核心观点 我们认为,数据和高速是我们认为,数据和高速是 AI 投资逻辑的核心抓手投资逻辑的核心抓手,伴随伴随 AI 场景应用场景应用的发展成熟,预训练数据服务是的发展成熟,预训练数据服务是 AI 产业链
2、走向分工明确的必然产物。产业链走向分工明确的必然产物。纵观 AI 产业链,上游数据是模型感知世界的起点,中游算法开发是数据应用的工具,下游场景应用拉动算法迭代,监管是贯穿上下游的刚需环节。本轮本轮 ChatGPT 浪潮的增长前期,模型使用过往成熟数据导致预训练数浪潮的增长前期,模型使用过往成熟数据导致预训练数据服务需求并未快速增长,据服务需求并未快速增长,是因为是因为预训练数据服务在预训练数据服务在 AI 发展过程中不发展过程中不需要需要?事实恰恰相反,预训练数据服务是事实恰恰相反,预训练数据服务是 AI 大模型降本增效、提高算大模型降本增效、提高算法精度、加速迭代的重要因素法精度、加速迭代的
3、重要因素。前期模型训练的核心目的是验证算法可行性,预训练数据多采用历史数据,如ChatGPT3.0 的预训练数据为截止到 2021 年 9 月的历史数据。因此,前期预训练数据服务需求并未随大模型的算法迭代增长而快速提升,但这并不意味着预训练数据服务是不重要的环节。伴随着场景应用的落地成为 AI 大模型新一轮的发展动能,大模型迭代的核心变成算法功能的拓展。AI 预训练数据需要承接下游场景采集的全新数据,AI预训练数据需求有望伴随场景应用的落地而快速增长。根据德勤预测,2027 年AI 预训练数据服务的市场规模有望达到 160 亿元,2022-2027 五年复合增速为28.9%。智能驾驶有望持续成
4、为弹性最大的下游应用场景,预训练数据需求前智能驾驶有望持续成为弹性最大的下游应用场景,预训练数据需求前置,需求置,需求的提升伴的提升伴随算法迭代和落地车型随算法迭代和落地车型的的量产时间或将呈现周期性量产时间或将呈现周期性收敛。收敛。预训练数据需求受自动驾驶算法迭代、新车型量产落地、新车渗透率等多重因素拉动,智能驾驶有望领先释放预训练数据服务的需求。当前行业将继续受益于 L2+向 L3 技术迭代带来的数据需求放量,2025 年之后基础数据需求或将开始相对收敛。2027 年迈入 L3+向 L4 的升级迭代,需求有望开启新一轮逐步释放。强者优势愈发显著,行业格局有望开启重塑步伐,科技巨头和专业数据
5、强者优势愈发显著,行业格局有望开启重塑步伐,科技巨头和专业数据服务商有望切分更多市场份额。服务商有望切分更多市场份额。随着行业进入快速发展期,行业逐渐向多模态、合规化、半自动化演变,科技巨头和专业预训练数据服务商具备更强的研发优势,有望领先享受半自动化标注的红利,形成资源整合和研发技术的壁垒,切分更多市场增量份额。-6%3%12%21%30%39%IT服务沪深300上证指数 谨请参阅尾页重要声明及财通证券股票和行业评级标准 2 行业深度分析报告/证券研究报告 投资建议:投资建议:伴随 AI 场景应用的发展成熟,预训练数据服务是 AI 产业链走向分工明确的必然产物,目前行业格局重塑期,科技巨头和
6、专业预训练数据服务商有望切分更多市场份额。建议关注:海天瑞声、汇洲智能、神州数码。风险提示:风险提示:基础数据服务商自动化标注研发进展不及预期;智能驾驶算法更新不及预期;新车型落地渗透率不及预期。表1.重点公司投资评级:代码代码 公司公司 总市值总市值(亿元)(亿元)收盘价收盘价(10.27)EPS(元)(元)PE 投资评级投资评级 2022A 2023E 2024E 2022A 2023E 2024E 688787 海天瑞声 40.34 66.86 0.69 0.85 1.24 86.51 79.09 53.78 未覆盖 002122 汇洲智能 82.55 4.14 0.04-72.22-未