AI 数据库的内存优化之路-陈迪豪.pdf

编号:153083 PDF 58页 15.70MB 下载积分:VIP专享
下载报告请您先登录!

AI 数据库的内存优化之路-陈迪豪.pdf

1、AI数据库的内存优化之路陈迪豪2023-02-07 第四范式/陈迪豪AI数据库的内存优化之路议程1.AI 数据库与内存性能优化2.OpenMLDB 与 Spark 内存案3.OpenMLDB 统编码优化实现4.内存优化在 AI 场景的应实践标 了解前沿的 AI 数据库架构设计 了解数据库内存优化思路以及实现细节 了解 OpenMLDB 内存优化在 AI 场景的实践议程1.AI 数据库与内存性能优化2.OpenMLDB 与 Spark 内存案3.OpenMLDB 统编码优化实现4.内存优化在 AI 场景的应实践AI 数据库介绍从 AlphaGo 到 ChatGPT,AI 落地应如后春笋般出现AI

2、 基础设施项越来愈多,涵盖芯设计、模型框架、数据库等AI 数据库逐渐成为 MLOps 的重要组件AI 数据库萌芽2017年开发以FE为核的数据库服务2020年落地超过100个机器学习场景2021年开源 OpenMLDB 数据库项OpenMLDB 数据库介绍致于解决 AI 程化落地的数据治理难题选 SQL 和数据库开发体验降低开发槛天然保证线上线下计算致性,实现毫秒级的计算延迟OpenMLDB 数据库介绍OpenMLDB 架构设计OpenMLDB 架构设计OpenMLDB 架构设计OpenMLDB 内存架构Row编码,同多列使连续内存存储离线在线使相同 Parser、Optimizer、Code

3、genLLVM JIT,对表达式成平台相关的优化执代码Spark集成,基于 Java JNI 调 C+代码接思考下Spark 内存优化与 OpenMLDB Row 优化如何解决冲突?议程1.AI 数据库与内存性能优化2.OpenMLDB 与 Spark 内存案3.OpenMLDB 统编码优化实现4.内存优化在 AI 场景的应实践Spark 简介Apache Spark has rapidly emerged as the de facto standard for big data processing.Spark Tungsten 内存优化Memory Management and Bina

4、ry ProcessingCache-aware computationCode generationSpark Tungsten 内存优化字符串“abcd”,UTF-8占4个字节JVM字符串Header占12个字节JVM字符串Hash代码占8个字节字符串内容4字节-JVM实际占24字节数据来源:https:/ Tungsten 内存优化基于多个 Column 对象实现 RowJVM 管理量对象,GC压Spark 需要频繁创建和销毁 JVM 对象Spark 了解数据流以及内存块命周期Spark UnsafeRow 优化基于 JVM Unsafe API(intrinsic)基于 Schema

5、和指针实现 Row存储,使连续内存读性能减少 JVM 对象和 GC 压Spark UnsafeRow 优化数据来源:https:/ UnsafeRow 优化64bit(8byte)对,内存空间不紧凑但有利于提访存性能端存储,这样低位类型存到位内存(如存int到64位)不需要额外编码所有列不管什么类型都按64bit存储,变内容顺延存储Nullbitset以64位为单位按需增加Spark UnsafeRow 优化GenericInternalRowUnsafeRowSpark UnsafeRow 优化通过 queryExecution 获取底层执计划InternalRow 默认实现为 Unsafe

6、Row通过指针和偏移获取列值Known issue:4paradigm/OpenMLDB#2880思考下Spark UnsafeRow 优化有什么问题?Spark 对 OpenMLDB Spark议程1.AI 数据库与内存性能优化2.OpenMLDB 与 Spark 内存案3.OpenMLDB 统编码优化实现4.内存优化在 AI 场景的应实践OpenMLDB 内存编码优化和Spark样,基于存储,最化在线读取性能相于Spark,基于C+指针实现,没有GC overhead相于Spark,增加Version header,持多版本格式相于Spark,Nullbitset以byte(8 bits)

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(AI 数据库的内存优化之路-陈迪豪.pdf)为本站 (张5G) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠