当前位置:首页 > 报告详情

中信证券基于 SelectDB 的实时数仓平台构建 - 余子安 中信证券.pdf

上传人: 表表 编号:599501 2025-01-24 27页 1.77MB

1、基于 SelectDB 的实时数仓平台构建Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024目录基于 CDP 的旧实时数仓01面临的困难与挑战02基于 SelectDB 的解决方案03未来展望04Doris Summit Asia 2024Doris S

2、ummit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 202401基于 CDP 的旧实时数仓Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris

3、Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024 实时计算面对的数据是实时且流式的,数据按照时间发生顺序被实时计算程序订阅和消费实时数据 触发源为无界流式数据,一旦有新的流数据进入实时计算系统,它就立刻发起并进行一次计算任务,因此整个过程是持续进行的持续计算 流处理的计算结果可以同流式数据一样,持续的写入目的数据存储实时数据集成实时计算:持续、低时延、事件触发的计算作业Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit

4、 Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024维度批量计算实时计算处理对象有界的静态数据集无界的动态数据流处理时延高:小时到分钟级低:秒级到毫秒级吞吐量大中到小容错机制相对简单数据不变可以重复计算复杂中间状态需要保证一致性触发机制定时任务持续运行Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit A

5、sia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024系统部分大数据组件KuduFlinkHbaseElasticSearchKafkaYarnImpalaHiveSparkDoris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit

6、 Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 202402面临的困难与挑战Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asi

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了基于SelectDB的实时数仓平台的构建目录,面临的困难与挑战,解决方案以及未来展望。 首先,文章指出了基于CDP的旧实时数仓面临的困难与挑战,包括实时计算的数据时效性、触发源的无界流式数据处理、流处理的计算结果的持续写入、实时数据集成、实时计算的复杂度以及运维成本高等问题。 其次,文章提出了基于SelectDB的解决方案。SelectDB具有MySQL协议兼容性,支持标准SQL,存储模型丰富,采用列式存储,具有高效的数据导入事务保障和并发控制,以及强大的查询引擎和权限控制能力。SelectDB的集群支持线性扩展,节点异常退出后可快速拉起恢复服务,运维简洁高效。 最后,文章展望了未来,SelectDB作为Apache基金会顶级项目,具备简单易用的架构设计、技术栈的统一管理、充足的英文文档、强悍的计算能力与便捷的部署使用能力,以及基于开源的生态融合能力,将满足现行需求以及未来可能的多样化需求。
"实时数仓如何提升业务决策效率?" "SelectDB如何简化技术架构复杂度?" "未来数仓平台的国际化发展趋势如何?"
客服
商务合作
小程序
服务号
折叠