1、演讲嘉宾:理 想 汽 车 封 磊数据编织在企业数据数据编织在企业数据AIAI 落地中的应用落地中的应用1数据编织概念数据编织概念2企业应用企业应用语义层建模语义层建模ChatBIChatBI指标增强指标增强3行业趋势行业趋势2.12.22.3数据编织 生态位语义编织理想世界底层世界企业操作系统复杂,混乱更新迭代快编织了系统能力边界中介/桥梁信息熵转换器语言的边界,就是世界的边界 逻辑哲学论用户:AI,用 AI 提问的用户,开发者编织者:语义层开发者,Gold信息熵:所有可能事件的信息量的平均值类比物理学的熵底层世界指企业内部最原子的业务单元,业务处理流程,业务知识图谱语义编织底层世界语义编织数
2、据编织 微观能力数据编织虚拟数仓数据编织:1)符号化 知识分层2)建立联系 类知识图谱3)知识增强和还原 信息熵的升降 物理数仓低熵高熵加工熵建模过程数据编织 产品视角数据编织虚拟数仓数据编织底层数据源+知识公共维度表宽表事实表 1事实表 2维度表 1维度表 2易于业务用户和 AI 理解的主题和字段术语业务应用数据知识图谱:表拓扑,字段拓扑,业务对象相关性拓扑 复杂行为函数映射数据场景应用业务知识表关系复杂行为函数库复杂技术性的原始知识复杂指标定义物理数仓建模过程数据编织 技术视角MCPJDBCAPIBI 报表Chat BI数据应用Agent意图理解意图澄清语 义 层MySQLSparkDor
3、isFlink意图改写知识增强性能增强联邦增强服务层意图层增强层应用层语义层物理层工作流事件驱动语义驱动人类在环AI 增强跨主题查询跨库查询显式知识关联智能聚合物化人类在环:1)流程在环:信任的心理学基础2)关键行动在环:避免事故冷热分离隐式知识关联配置管理层语义模型配置 复杂指标/权限 表关系/字段关系 虚拟字段映射知识图谱预学习全链路监控运维数据编织 ChatBINL2物理SQLNL2DSLNL2 语义 SQL物理业务表语义层建模数据编织数仓建模(宽表)数仓建模(宽表)物理业务表物理业务表NL2 语义 DSL语义层建模数据编织物理业务表降低大模型理解现实世界的复杂度在业务语义的逻辑世界和真
4、实的物理世界之间建立桥梁外挂 Agent处理多步骤问题前置小模型做微观意图分类方案一方案三方案四方案五数仓建模(灵活)数仓建模(灵活)不强依赖宽表预加工跨域&跨源建模更灵活NL2物理Code物理业务表数仓建模(宽表)方案二加速层会自动创建宽表无需人工开发维护人类在环:意图澄清,修改,确认1.代码一次性生成难度高,企业知识密度大,经常变动2.人类在环困难,代码过于复杂,语法解析难度高数据编织 ChatBI此步骤【模型】负责用户意图的宏观结构表达圈定能力边界此步骤的前50%,关键特征识别【模型】负责此步骤的后50%,特征细节补全【工程】负责此步骤用户可以参与对人类原子特征的确认和修正。比如眼镜,眉
5、毛,鼻子,嘴,耳朵此步骤【工程】负责企业私有知识库找到同型号的衣服,裤子。小模型直接渲染细节。而不是大模型模型渲染。数据编织 知识分层,预学习,推理增强行动认知/智慧知识信息确定性的知识和行动不确定性的信息符号语言CoTAST/Function CallGraph语义模型Vector Retrieval Hybrid Search数据基座(决策依据)服务基座(行动)关系知识事实知识Workflow Event自然语言认知符号语言符号语言LLM1)预学习&SFT2)测试3)线上推理4)评测数据编织 知识分层,建模,预学习数据编织 知识分层,推理推理中推理前原始 Query推理后精确语义增强业务知
6、识增强信息显示还原模糊语义层Prompt Builder数据编织 符号语言符号业务对象解释项指向/代表赋予符号意义中介通过符号中介隐藏业务对象大量的信息熵解释项:1)同一个业务单元,定义常变2)不同业务单元,定义不同3)解释项反向寻找符号4)相似解释项消歧符号:1)指代符号,运算符号(关系,计算,连接)指代符号通常是全局唯一的 运算符号负责聚合计算或关联多个指代符号2)子符号拆解和 DAG 引用业务对象:1)即研究业务对象的属性,也研究自然时间的行为事件2)既可以是一个业务对象,也可以是多个业务对象,通过符号编织在一起3)多个业务对象可以是显式的关联关系