当前位置:首页 > 报告详情

存算分离:Apache Doris 部署新范式 - 杨勇强.pdf

上传人: 表表 编号:599510 2025-01-24 20页 8.62MB

1、存存算算分分离离:A Ap pa ac ch he e D Do or ri is s 3 3.0 0 部部署署新新范范式式杨杨勇勇强强 Apache Doris PMCDoris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024目录存算分离技术特性01存算分离典

2、型应用02Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024存存算算分分离离架架构构Meta ServiceCompute Group ABECacheBECacheBECacheCompute Group BBECacheBECacheBECacheS

3、3/OSS/Azure/GCP/HDFS存算一体架构存算分离当前架构存算分离目标架构DiskFEDiskFEDiskFEDiskBEDiskBEDiskBEDiskBEDiskFEDiskFEDiskFEMeta ServiceCompute Group AComputeNodeCacheCompute Group BComputeNodeCacheComputeNodeCacheComputeNodeCacheComputeNodeCacheComputeNodeCacheS3/OSS/Azure/GCP/HDFSDoris Summit Asia 2024Doris Summit Asia

4、 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024存存算算分分离离查查询询性性能能完完全全命命中中:预热之后数据都在doris page cache 或者 linux page cache部部分分命命中中:开始时三级cache都为空,顺序跑 tpcds 的查询,取第一遍的成绩完完全全未未命命中中:每个 TPCDS 的 SQL 开始

5、时清空三级缓存多多层层 C Ca ac ch he e0100200300400500600700800完全命中缓存部分命中缓存完全未命中存算分离存算一体本地磁盘 cache 压缩数据Linux Page Cache 压缩数据Doris Page Cache 解压后的数据持久化存储S S3 3A Amma az zo on nDoris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Dori

6、s Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024存存算算分分离离数数据据及及时时性性32 并发 flink 写入,checkpoint 周期 5s。A:引入 metaservice 的存算分离实现;B:meta 写入对象的存算分离实现。Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Apache Doris 3.0的存算分离部署新范式。存算分离技术具有低成本、弹性和负载隔离等特性。通过引入Meta Service和多层Cache,实现了查询性能的提升,包括完全命中、部分命中及完全未命中情况。存算分离的架构包括Meta Service、Compute Group A和Compute Group B,以及与S3/OSS/Azure/GCP/HDFS的集成。此外,存算分离能够实现低成本的存储和计算资源池化,提高资源利用率,并且可以灵活调整计算资源以应对业务高峰或降低成本。典型应用场景包括在线业务降低成本、历史数据降低成本、快速扩缩容应对大促、多业务线共享数据负载隔离等。存算分离的目标架构是实现存算分离的查询性能提升和资源利用率优化。
存算分离技术如何实现低成本与弹性? 存算分离在典型应用中如何体现负载隔离的优势? 存算分离如何助力新一代数据基座的构建?
客服
商务合作
小程序
服务号
折叠