1、ChatBI在携程的应用演讲人:岳扶天Content目目录录01 数据分析数据分析现状及痛点现状及痛点02 基于基于ChatBI的智能助手方案的智能助手方案03 LLM和和Agent技技术的应用术的应用04 ChatBI的未来展望的未来展望01数据分析数据分析现状及痛点现状及痛点第一章节数据分析现状及痛点业务涉及众多市场和产品线,维度复杂口径难统一传统可视化工具有局限性,复杂问题依旧要通过SQL实现取数、答疑工作繁多,工作时间碎片化数据团队员工的知识、数据分析经验难以复用02基于基于ChatBI的智能助手方案的智能助手方案第二章节ChatBI的目标AI应用 智能数据知识获取。包括数据表知识、数
2、据概念、指标知识等等。智能取数。实现基于指标系统的取数和NL2SQL取数。支持生成分析报告。基于查数结果分析、基于固定模板数据分析。支持基于数据的业务策略建议。数据基建 完善数仓表元数据。数据表描述、字段描述需要清晰,需具备数据表血缘、字段血缘。完善数据字典。重要数据主题的数据字典建设,帮助大模型知道每个主题中的常用表。建立BI知识库。增效:让业务可以更高效的获取数据,同时降低数据团队日常答疑和支持的工作量赋能:自动化的分析报告和业务解读,策略输出以赋能业务发展整体产品架构03LLM和和Agent技技术的应用术的应用第三章节BI知识库构建 基于文档系统维护:业务主题的数据字典 基本数据概念、术
3、语文档知识 支持个人维护工作文档私人知识 表结构 Table Schema 表档案 Table Profile 表的下游用法 Table Trace 表的下游任务 Table Task表知识 指标定义 指标SQL指标知识BI知识库构建Table Schema一个良好的Schema描述有助于LLM更好的理解数据库中的数据内容和数据结构,从而生成更准确的SQL;只要 LLM 理解数据库结构的能力足够强,提示中的给到的数据库描述越详细,SQL 最终生成的准确率也越高。Table Profile使用大语言模型结合表Schema 和 上游表Schema,对目标表的生成逻辑和数据构建流程进行清晰的描述,使
4、LLM清晰的理解待生成SQL的表数据Flow,以及注意的筛选字段。BI知识库构建Table Trace追踪目标表在下游使用时的用法,一方面有助于LLM理解业务,另外一方面追踪到的各种用法也有助于避免LLM在生成SQL的时候出现一些幻觉。column trace:列追踪,主要追踪列在下游表达式和变换的使用(排除掉直接筛选的列);condition_trace:谓语条件追踪,追踪下游表在使用目标表时主要会使用哪些谓语用于过滤条件;groupby_trace:聚合条件追踪,追踪下游表在使用目标表时会使用哪些字段作为聚合条件;columns_counter:统计下游在使用本表时,哪些字段使用的频率较高
5、,有助于LLM在Schema选择的时候提升正确率;relevant_tables_counter:统计下游在使用本表时会与哪些表一起联合使用及其频率,在多表SQL时,用于指导LLM选择相应的关联表。Table Task将使用本表的下游任务进行自然语言转写(Natural Language),然后进行嵌入Embedding 召回,在进行NL2SQL任务时,召回与任务高度相关的下游任务作为参照SQL,提升LLM准确率Multi Agent 架构任务列表Planner AgentKnowledgeServer文本检索向量检索SSE MCP Server业务人员分析师ETL多轮问答交互PlanThou
6、ghtACTKnowledge Agent业务知识数据知识NL2SQL Agent统筹管理SQL Writer Agent、SQL Reviewer AgentSQL Writer Agent检索知识生成SQLSQL Reviewer Agent语法检查符合业务需求Index AgentPlanningUser Interaction Task Execute AgentTool AgentMCP ServerFunction Call AgentRecall AgentReflectionAgentDisplay AgentMemory AgentTable Server数据知识检索SQL