《A3--倪海峰--Data Agent在汽车行业的应用实践.pdf》由会员分享,可在线阅读,更多相关《A3--倪海峰--Data Agent在汽车行业的应用实践.pdf(38页珍藏版)》请在三个皮匠报告上搜索。
1、Data Agent在汽车行业的应用实践倪海峰(海迩)阿里云智能,AI汽车技术服务高级专家倪海峰(海迩)阿里云-公共云事业部,技术服务高级专家阿里云AI汽车行业技术服务高级专家,曾任职于蔚来汽车、Thoughtworks等知名企业。长期深耕云计算与AI在汽车行业业务场景的工程落地,十余年一线客户服务及专项实战经验,内容涵盖DevOps、FinOps、SRE、Data+AI等专业领域。多次国内顶级峰会主讲人。01020304 Data Agent行业趋势技术架构车企落地实战总结与未来展望Data Agent行业趋势AI驱动数据分析范式转变增强型商业智能(指标平台)数据平台+BI工具基于大模型(智
2、能BI)数据平台+大模型+BI工具1.采用更高级的数据分析技术、如:数据挖掘、预测分析和机器学习;2.提供更深入的洞察,支持更复杂的数据集和分析类型;3.大数据技术和AI分析算法工具相结合,但是开发周期和灵活性较差。1.通过大模型对自然语言的理解与生成能力来进行查询、分析和获取数据洞察,极大提高了易用性和访问性。2.支持复杂数据查询,以更直观、互动的方式展示结果,非技术用户也能轻松的利用数据进行分析。3.改变传统数据仓库构建模式。传统商业智能(传统BI)传统数据库+传统报表与大屏展示1、专注与数据收集、存储和基本报告功能;2、静态、预设的,重点在于过去的离线数据分析,生成标准报告和图表;3、用
3、户交互局限,主要依靠IT专家进行数据查询和报告生成。传统的报表式分析数据仓库式的自助式分析以业务人员主导的Data Agent敏捷分析从传统BI走向以业务人员主导的Data Agent车企数据分析的特殊挑战上线前上线前定制化开发周期长、需求排队 报告繁多、不够灵活企业Data Agent的挑战不在于模型是否聪明,而是系统是否一个足够稳定的企业语义基础设施,来约束模型的理解边界。上线后上线后便捷问答、灵活展示从可演示Demo到工程化落地准确性准确性/一致性不足一致性不足同名字段,语义不同同名指标,统计口径不同同一个业务,团队定义不同安全与合规不可控安全与合规不可控用户越权查询拼接敏感字段高开销查
4、询影响集群性能可解释性不足可解释性不足没有稳定回归集没有线上问题闭环无法持续迭代企业级Data Agent落地的三堵墙用语义层约束模型把治理能力下沉到数据平台用Agent链路取代单次Prompt以生产可用为目标生产可用的Data Agent工程属性准确可控口径一致安全合规高效性能可观测可演进Data Agent架构体系简介大模型层Data Agent智能体层用户交互层Qwen系列GLM系列DeepSeek系列NL2SQL专家模型私有化部署模型服务数据开发Agent数据治理Agent数据分析Agent引擎管控与运维Agent第三方Skill第三方MCP知识库/Rules语义模型ChatUITUI
5、/CLIIM ChannelRemote Control(H5)Agent 协议层(ACP/A2A)快捷问数 归因分析深度分析报告生成 报告分享行动建议Agent上下文与扩展快捷找表元数据增强AI检查器血缘分析 治理计划生成数据质量生成需求分析 NL2SQL任务构建代码Review运维诊断工作流构建异常诊断 智能运维资源管理知识问答 集群配置性能优化Data Agent:新一代数据智能体计算资源层MaxComputeHologresEMR SparkEMR StarRocksFlinkAI搜索(ES、OS)AI计算(PAI DLC)数据湖仓层OpenLake(Lakehouse)Data Wa
6、rehouse知识语义层(核心竞争力知识工程)语义层是一个知识工程,是决定Data Agent准确率的核心因素痛点 1:AI 看不懂数据表名是技术编号,字段含义靠口口相传 L1 Schema 增强+L2 指标与术语痛点 2:AI 不知道数据关系看不到血缘、JOIN 路径、质量状态 L3 关系与血缘+L4 管道与质量痛点 3:AI 没有组织知识看不到团队规范、仓库搬迁、营销活动等业务事件 L5 学习与增强+L6 组织与协同L1Schema 增强增强表/字段语义 数据域编目 标签L2指标与术语指标与术语指标口径 业务术语同义词 数据标准L3关系与血缘关系与血缘表血缘 JOIN 路径多跳推理L4管道