1、岑润哲数势科技|数据智能产品总经理大数据+大模型:构建企业新一代智能分析Agent,释放数据要素价值分 享 主 题目 录数据民主化:实现数据要素价值释放的关键01解决思路分享:指标平台与AI Agent能力融合,突破数据价值化难题02落地案例分享:围绕消费零售与金融行业,解析Data+AI如何释放数据要素价值03总结与展望:重点突破的难点和未来展望04当前集中式数据分析的企业现状与痛点从集中式到民主式数据分析的演进过程民主式数据分析赋能企业每一个公民实现从数据消费到决策数据民主化:实现数据要素价值释放的关键企业集中式数据分析现状:数据需求无限,开发资源有限,需求排队严重数据工程师杂乱数据源数据
2、需求需求排队产品运营团队数据开发开发完成IT部门供应链团队会员运营团队门店经理客服团队从集中式到民主式数据分析的演进过程粗旷式集中式/分散式发展阶段低高民主式分析效能阶段特点小规模、小数据分析分析可靠性不稳定,不灵活通常在个人层面闭环中等/大规模数据分析分析效率不稳定,质量差,依赖路径较长。响应慢大规模、海量数据分析全体用户级自助式分析分析到决策制定链路短,响应快参与人群规模少数个体中等大规模用户角色独立分析师IT开发团队、商业分析师数据科学家、数据分析师企业公民分析工具Excel、SQL、IDE ToolsBI工具、Excel、notebook.指标平台、大模型、生成式BI、.民主式数据分析
3、:让企业内每一个公民可以实现从数据消费到决策数据消费者数据应用核心价值过往当前未来受众群体=1%业务决策者财务等数据“依赖者”受众群体=15%+BI分析师+业务分析师受众群体=95%+业务全员+上下游合作伙伴WhatWhat&WhyWhat&Why&How数据分析工具Excel数仓+BI指标语义层+大模型数据业务化:以指标体系和指标平台弥合业务人员与技术人员的数字鸿沟,实现数据即业务数据价值化:为人人配上数据智能小助手AI Agent,让数据获取和洞察像聊天一样简单解决思路分享:指标平台与AI Agent能力融合,突破数据价值化难题数据业务化:以指标语义层和指标平台弥合业务人员与技术人员的数字
4、鸿沟统一语义层(Unified Business Semantic Layer)是现代数据栈中的一个独立且可互操作的部分,它位于数据源与数据使用者之间。统一语义层使得所有的数据端点,无论是BI(商业智能)工具、嵌入式分析,还是AI Agent,都能使用相同的业务语义和底层数据,从而得到一致且可信赖的洞察。数据源统一语义层数据应用指标语义层怎么建:仓内语义(NL2SQL)繁琐复杂,业务指向性差数据湖数据应用数据仓库集市层数据仓库DW层指标呈现数据集存储及加工原始数据表1原始数据表3原始数据表n数据应用表1事实维度宽表 V2.0数据应用表n维度表维度表事实明细表事实明细表原始数据表2维度宽表带有维
5、度的轻度汇总表数据应用表2数据应用表3带有维度的轻度汇总表BI工具数据集1数据集2支付人数22,000数据上传维度数据大屏数据集3交易人数25,000数据同步交易人数22,000访问人数100,000ODS-DWD-DWS-ADS,语义建在哪一层?数据产品经理、数据开发、终端数据使用者,谁来建数据语义?指标语义层怎么建:仓外语义灵活便捷,更加贴近业务数据湖数据应用指标语义层(由指标平台低代码实现)数据仓库DWD原始数据表1原始数据表3原始数据表n维度表维度表事实明细表事实明细表原始数据表2数据大屏BI工具借款人数原子指标渠道维度期限月至今统计周期昨日规范化加工原子指标、维度等积木式组装派生和衍
6、生指标昨日A渠道借款人数昨日A渠道贷款页访问人数昨日借款转化率借款转化率周环比指标API服务贷款页浏览人数指标语义层:指标字段所需维度统计周期聚合方式约束条件统计步长元数据信息Data Agent数据建模右移,更贴近数据消费endpoint,更便于LLM Agent 规划推理;基于虚拟层做数据编织,口径管理更灵活、便捷Data Agent怎么建:仓外语义LLM Agent方案-NL2semantic数据可信,准确率高 预设数据指标的定义与管理,避免业务理解对不齐 借助思维链分析与歧义反问,提升泛化性,避免直接从文本到SQL学习成本低 无需对大模型做预训练,仅需依据指标语义和知识库做用户意图理解