1、演讲嘉宾:赵祎祺以 NoETL 指标语义层为核心打造可信、智能的 Data Agent 产品实践0 1智能数据分析的挑战与误区智能数据分析的挑战与误区0 2指标语义层:智能数据分析的基石指标语义层:智能数据分析的基石0 3端到端的数据分析智能支持端到端的数据分析智能支持0 4产品功能演示产品功能演示0 1 智能数据分析的挑战与误区智能数据分析的挑战与误区大模型加速企业数智化转型,推动数据民主化传统 BI(1990s-2010s)敏捷 BI(2010s-2020s)智能 BI(2020s-至今)主导用户IT 人员+分析师(10%)IT 人员(1%)业务人员(90%)实现方案代码开发基于数据集制作
2、报表基于大模型的数据分析 Agent方案特点 IT 主导:依赖代码开发 集中式:固定报表、大屏 开发周期:数月 自助式:拖拉拽分析 业务驱动:固定报表+自助分析 开发周期:数天到数周 AI 增强:AI 驱动的数据分析 主动洞察:取数+归因+洞察 开发周期:秒到分钟级误区一:有数据就能做好智能分析今年的销售额表现如何?为什么销售额下降了?影响销量的因素有哪些?大模型口径误解互相矛盾无法信任未经治理的原始数据数据 洞察误区二:智能问数就是终点智能问数智能问数智能分析智能分析智能决策智能决策是什么:描述现状,提高数据获取效率为什么:诊断根因,理解业务数据波动背后的驱动因素怎么办:驱动决策,将数据发现
3、转化为可执行的业务行动问数是过程,不是结果误区三:Chat 是唯一的交互方式Chat:交互方式单一,不适合复杂分析场景多模式交互 Chat:适合快速、临时的查数目标 GUI:适合有明确路径的查数动作 分析报告:适合深度、结构化的数据分析构建与沉淀0 2 指标语义层:智能数据分析的基石指标语义层:智能数据分析的基石什么是指标语义层?业务系统数据日志数据第三方数据维度表事实表事实表维度表宽维度表宽事实表宽事实表宽事实表各类汇总表更大的宽表更大的宽表明明细细层层汇汇总总层层应应用用层层多工具多场景经营分析运营分析A B 实验指指标标平平台台(语语义义层层):逻辑层与物理层解耦,无需大量宽表和汇总表开
4、发语语义义模模型型原原子子指指标标派派生生指指标标复复合合指指标标业务系统数据日志数据第三方数据维度表事实表事实表维度表多工具多场景经营分析运营分析A B 实验订单表成交时间订单 ID产品 ID客户 ID交易金额销售数量销售价格客户表客户 ID客户名称客户所在地区产品表产品 ID产品名称类目表产品 ID产品类目 ID产品类目名称退款表退款时间退款 ID订单 ID产品 ID客户 ID退款金额退款状态退款原因语义数据模型(逻辑关系而非物理关联)交易金额交易客户数交易订单量退款金额退款订单量退款客户数指标维度客户名称客户所在地区产品名称产品类目名称退款原因虚拟大宽表语义模型定义指标,实现数据查询的灵
5、活性与全面性基于明细指标语义层,定义少量基础指标实现大量场景覆盖销售额复购率时间趋势基于指标语义定义能力,只需定义原子指标或复合指标,规避指标检索时大量相似指标名称问题过去 30 天销售额、每日销售额、财年总销售额、销售额月同比增长率.定义 1 个原子/复合指标实现大量派生指标问数场景平均/极值本月日均销售额、本月最大销售额、本月最小销售额.维值过滤天猫销售额、JJ 品牌销售额、EC 渠道销售额.占比排名不同渠道的销售额占比、上个月销售额排名前 3 的商品及其排名.定义 1 个原子/复合指标实现任意维度组合分析复购率不同【渠道】的复购率不同【会员等级】的复购率不同【商品类型】的复购率不同【品牌
6、】的复购率.为什么需要指标语义层基础指标可分析维度指标计算关系自然语言提问大模型:语义编译指标语义层 地图统一的指标、维度定义,将业务语言转化为计算逻辑;完善的指标血缘关系,所有查询分析均可追溯可解释;语义编译器 导航把自然语言问题编译成“指标+维度+过滤+时间”的规范查询。SQL 生成查询引擎智能加速权限管控查询引擎层 行动自研语义定义函数,100%准确的查询 SQL 生成;保障最优数据查询性能,平衡性能与成本;基于指标的行列权限能力,实现精细化的权限管控一个基于指标语义层的简单查询执行流程用户提问:今年华南大区的销售额是多少?理解问题,识别问题中的关