当前位置:首页 > 报告详情

滴滴数据血缘建设实践.pdf

上传人: 芦苇 编号:651599 2025-05-01 41页 7.82MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了滴滴出行在数据血缘建设方面的实践和未来规划。滴滴数据体系采用了多种技术如Spark、Hive、Flink等,构建了统一资源调度和统一元数据管理的数据环境。数据血缘建设经历了从初建到完善的过程,目前血缘覆盖全,准确率达到99.99%,解析任务达到千万级。 滴滴的血缘建设总览分为三个阶段:初建血缘、扩大覆盖面提升准确率、应用扩展工具化。在血缘建设中遇到了包括解析效率、稳定性、UDF资源等问题,并通过优化解决了这些问题。血缘存储采用了JanusGraph,并设计了节点uri体系,通过JGraphT的API快速检测节点间的血缘关系。 在血缘应用方面,滴滴实现了数据地图、关系检测、变更通知等功能,并应用于数据开发、数据治理等场景。对于核心下游检测,滴滴通过标注线上核心节点和回流线上核心Hive表,保障了核心系统的稳定性。此外,滴滴还通过虚实线区分跨业务线引用,并计算节点与源头节点的最长路径,实现了跨业务线跨层治理。 未来规划方面,滴滴将继续完善血缘生态,提高血缘实时性,支持更多场景的血缘实时化,并基于血缘做治理能力升级,结合大模型提升血缘分析智能化水平,实现行级、算子级血缘产品化。
"滴滴如何实践数据血缘建设?" "数据血缘在滴滴数据治理中的应用有哪些?" "滴滴未来数据血缘建设有哪些规划?"
客服
商务合作
小程序
服务号
折叠