1、面向未来的数据管理架构CONTENTS2024Data Always Ready一引言1二DataFabric的历史背景与定义2四DataFabric的关键特性和主要技术111.DataFabric的关键特性122.DataFabric的主要技术14三DataFabric与其他概念的比较41.DataFabric与数据仓库、数据湖、数据湖仓的比较42.DataFabric与DataMesh的比较63.DataFabric与数据中台的比较94.DataFabric与DataOps的比较95.DataFabric与数据虚拟化的比较11六七八AloudataDataFabric产品介绍24Aloud
2、ataDataFabric案例介绍32结论与展望341.AloudataAIR逻辑数据平台251.招商银行基于精准列算子血缘分析技术的模型优化和变更协同 应用实践322.AloudataBIG主动元数据平台252.某股份制银行敏捷数据服务体系建设实践323.AloudataCAN自动化指标平台293.某证券公司NoETL敏捷分析解决方案33五Aloudata的DataFabric之道161.一个新平面162.“NoETL”架构的四大特性183.三大引擎20Aloudata 202401多云环境,此类环境下的数据孤岛问题难以通过单一的物理集中的数据管理架构解决。从整体来看,企业数据管理正变得异常
3、复杂和难以控制,传统的数据管理架构往往依赖于单一、物理集中的数据仓库系统,这种架构已很难适应企业发展的需要,企业需要一种全新的数据管理架构,以便能够应对复杂数据环境,更有效地管理和利用日益增长的数据资产。在此背景下,DataFabric的概念应运而生,被视为面向未来的数据管理解决方案。本白皮书将会重点探讨数字化时代下,企业走向数据驱动过程中在数据管理上面临的关键挑战,结合对DataFabric概念、关键能力以及特性的介绍及剖析,阐述为什么DataFabric是企业数据管理的未来,并介绍如何通过 AloudataNoETL数据工程范式落地DataFabric架构思想,加快释放企业数据价值。在当今
4、时代,数据管理领域正面临前所未有的机遇与挑战。随着组织和企业经营活动数字化进程的不断加快,叠加云计算和大数据技术的快速进步,组织和企业所处理的数据量不断增长,数据的类型日趋复杂,这对数据管理架构提出了新的要求。随着企业数智化建设的深入,数据分析需求从管理层往业务一线人员蔓移,产生了新的需求用例和新的数据技术堆栈,数据存储和计算引擎更加分散更加多样,数据需求响应效率与数据质量、数据安全等风险越来越难以兼顾;随着数据安全、用户隐私保护和数据流通合规的规范和细则越来越明确清晰,企业在数据流通上面临数据持有权、管理权、使用权上的冲突,比如构建单一的物理集中的数据管理架构往往很难在跨业经营、跨国经营的集
5、团型公司中成功实施;随着云计算技术的普及,企业内外部普遍存在混合云或一、引言Aloudata 202402二、DataFabric的历史背景与定义图1:DataFabric2.0的架构示意图,来源:Forrester研究报告,Aloudata 二次绘制DataFabric(数据编织)这一概念最早出现在2000年代中期,由Forrester的分析师NoelYuhanna提出,2016年ForresterWave正式增加BigDataFabric这一类别(TheForresterWave:BigDataFabric,Q42016|Forrester),此后DataFabric这一概念开始频繁出现在
6、Forrester的各种报告里。Forrester认为DataFabric“提供了一个统一的、集成的、智能的端到端的数据平台,以支持新出现的需求场景”(Datafabricdeliversaunified,inte-grated,andintelligentend-to-enddataplatformtosupportnewandemergingusecases),并于2023年提出了DataFabric2.0(DataFabric2.0ForConnectedIntelligence|Forrester),在各个层级都引入AI/ML的能力,以提升系统自动化能力。Aloudata 202403