1、?2?|?2024?报告编委 报告指导人 张扬 爱分析 联合创始人&首席分析师 报告执笔人 孟晨静 爱分析 分析师 外部专家(按姓氏拼音排序)田岚 火山引擎 数据产品大消费行业解决方案负责人 范涛 科杰科技 售前解决方案专家?3?|?2024?特别鸣谢(按拼音排序)?4?|?2024?目录 1.报告综述?6 2.数据能力建设?9 3.湖仓一体?17 4.对话式分析?21 关于爱分析?24 研究咨询服务?25 法律声明?26?5?|?2024?报告综述?6?|?2024?1.报告综述 数据能力已经成为企业的核心竞争力。政策驱动数据产业发展加速,如 2023 年国家数据局成立,负责协调推进数据基础
2、制度建设,统筹数据资源整合共享和开发利用;2024 年,“数据要素”三年行动计划(2024-2026 年)正式发布,要求数据要素应用广度和深度大幅拓展,聚焦十二个重要领域打造 300 个示范性强的典型应用场景。同时,2024 年起正式将数据资源视为资产纳入财务报表,推动企业数据驱动价值创造。可以看出,近两年国家数据产业政策逐渐深化,从制度建设向落地应用过渡。在企业端,面向复杂的市场环境和多变的客户需求,企业对数据的依赖和挖掘愈发深入,敏捷强健的数据能力支撑成为企业实现数据驱动、获得市场竞争优势的前提。爱分析观察到,企业在数据能力构建中有两个明显趋势。第一,企业数据能力的建设以数据消费为核心,以
3、业务价值为牵引。企业以往在构建数据能力时,通常是由技术部门或数据部门进行统一规划,并进行数据开发与管理,业务部门被动的使用企业的数据能力。然而,随着业务部门对数据价值的逐渐重视,以及对数据应用需求的快速增加,企业技术部门或数据部门已经不能满足业务部门的用数需求。为赋能业务部门更好的使用数据,企业数据智能基础设施的构建正逐渐转变为以数据消费为核心,基于业务价值创造需求对基础设施进行持续迭代。第二,企业快速更新数据基础设施以迭代数据能力。湖仓一体成数据平台架构迭代新方向。企业面临的数据环境日益复杂,如海量多元异构数据的爆发式增长带来的存储成本攀升,业务广泛落地 AI 应用要求对非结构化数据进行预测
4、、探索分析,以及越来越多分析业务对计算时效从 T+1 提升到准实时或实时等。而企业建立在数据仓库或数据湖之上的数据平台无论在性能、存储成本、运维成本等方面均面临瓶颈,难以适应复杂数据环境。在此情况下,湖仓一体以其流批一体、弹性存储、多工作负载等特征成为数据平台架构迭代的新方向。?7?|?2024?对话式数据分析成为数据基础设施融合大模型能力的率先落地场景。据爱分析观察,通过自动化、智能化提升效率将是企业数据基础设施的下一步迭代方向,而具备强大学习和预测能力的大模型,是实现数据基础设施自动化、智能化的关键技术。其中,数据分析是大模型与数据基础设施融合的优先落地场景。与传统数据分析相比,基于大模型
5、的对话式数据分析具有明显的优点。如传统的数据分析方式中,固定报表依赖 IT 部门,探索性弱且重复开发现象严重,自助式 BI 虽然具备探索性,但门槛较高,难以推广到业务人员全员使用。对话式分析以自然语言对业务需求灵活响应、端到端数据洞察的自动化输出以及数据开发工作的简化等特征能有效改善传统数据分析体验痛点,实现全员数据分析。在以上背景下,本报告选择数据能力建设、湖仓一体、对话式分析三个重点市场进行应用实践分析,为数据能力建设企业提供提供实践经验,加速推进数字化转型升级。?8?|?2024?数据能力建设?9?|?2024?2.数据能力建设 2 2.1?.1?多年的数字化转型,企业已经完成基础数据设
6、施建设,如针对数据汇集,已经建设起大数据平台或数据中台;针对经营分析,建立起管理驾驶舱、业务看板;针对数据开发管理,搭建了离线、实时或是批流一体的计算链路。但企业在实际用数过程中仍存在重重障碍,诸如数据质量差、指标体系混乱、业务需求响应速度慢等,距离实现数据驱动决策仍有较远距离。以数据治理为例,从 2004 年起很多大型企业就开始进行数据治理,但数据质量差仍是企业面临的主要问题。数据中台更是被寄予厚望,数据中台完成了全域数据的集成,但由于缺少业务部门参与,实际的数据整合以及数据共享服务很难支撑业务应用,业务部门“取数难”、“用数难”的问题还是没有解决。2.22.2?数据能力建设需要打通数据生命