当前位置:首页 > 报告详情

钛铂数据&InfoQ:企业实时数据服务平台建设最佳实践(2023)(39页).pdf

上传人: 小小 编号:121037 2023-04-06 39页 5.47MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了数据处理和数据源管理的相关概念。关键点如下: 1. 数据连接类型对象:Connector,用于支持不同数据源的查询。 2. 数据连接对象:Connection,可以创建支持的平台上的数据源。 3. 数据源:Source,定义了具有特定结构的数据来源,由特性的Connection和其下层结构描述组成。 4. 核心对象:Pipeline,用于定义计算过程,可以执行多种数据处理任务,如无状态数据处理、有状态数据复制、多流JOIN和多表合并等。 5. Job:Pipeline的运行态,可以进行启动、停止、监控等多种运维操作。 6. DataCheck:辅助过程,用于在1:1数据复制过程中实时检测源与目标是否一致。 7. DataTrace:辅助过程,用于检测特定数据模型的前向数据血缘和后向数据引用。 8. API:数据操作,可以将特定数据结构发布为HTTP CURD接口,与数据连接类型无关。 此外,文章还提供了一个bash脚本示例,用于登录Live Data Platform Shell,并展示了如何使用数据源、表和任务等操作。
"数据连接对象有哪些功能?" "如何使用Pipeline进行数据处理?" "DataCheck和DataTrace有什么作用?"
客服
商务合作
小程序
服务号
折叠