1.olap是什么
1993年,关系数据库之父E.F.Codd率先提出了联机分析处理(Online Analytical Processing,
OLAP)的概念,是为了解决对多维数据进行分析的问题。OLAP相关技术使得分析决策人员可以对原始数据进行多维度、多层次的转化,以提取有效信息,提供决策支持。
根据OLAP委员会的定义:OLAP是使分析人员,管理人员或执行人员能够从多种角度对从原始数据中转化出来的,能够真正为用户所理解的并真实反映维数据特性的信息进行快速、一致、交互的存取,从而获得对数据更深入了解的一类软件技术。
2.OLAP相关概念
(1)维度:维度是观察数据的角度,在关系数据中就是数据的一组属性,用于对数据进行不同维度上的分析,例如有地区维、时间维。
(2)维度成员:维度成员是维度的某个具体取值,例如地区维的维度成员包括南京、上海等,时间维的维度成员包括第一季度、第二季度等。
(3)维度层次:维度本身的层次结构,用于对数据进行不同粒度上的分析,例如地区维可以包含国家、省、市、区的层次结构。
(4)度量:度量是能够聚集并用于分析展示的数据,例如销售数据中销售量和销售额都可以作为度量,根据指定的维度对度量进行聚集可以得到关心的聚合数据。
(5)多维数据模型:多维数据模型是基于维度和细节数据构建的,围绕主题进行组织,便于用户的多维度、多层次分析,典型的多维数据模型包括星型模式、雪花模式和事实星座模式。
(6)数据立方体:数据立方体是由维度构建起来的多维空间,包含要分析的细节数据,使用多维数据模型存储在数据仓库中,数据的OLAP操作都基于立方体进行。
(7)OLAP操作:基于数据立方体,OLAP操作可以得到不同角度、不同粒度上的数据视图,因此用户能够进行交互式查询和数据分析,常见的
OLAP操作包括上卷、下钻、切片、切块和旋转,具体解释如下:
1)下钻(钻取):沿着某一维度,将数据向下拆分到更细粒度的层次,该过程是从汇总数据得到细节数据;
2)上卷:沿着某一维度,将数据向上聚集到更粗粒度的层次,该过程是从细节数据得到汇总数据;
3)切片:选定维度上特定的值,分析度量在其他维度上的分布情况;
4)切块:选定维度上特定区间的值,分析度量在其他维度上的分布情况;
5)旋转:互换维度的位置,得到不同视角下的数据。
3.OLAP与OLTP的区别与联系
当数据正确地存储在数据仓库中后,可以用多种方法支持决策。OLAP是使用最广的数据分析技术,OLAP通过对组织数据资源库(如数据仓库、数据集市)的多维分析,可以快速查询并快速解决特定的问题。
OLTP是用于描述事务处理系统的专业术语,这些事务处理系统主要负责获取和存储与日常业务相关的数据,例如 ERP、CRM
等。OLTP处理业务需要使日常业务自动进行,并产生实时报表和常规分析。单OLTP系统不适合进行大量数据的即时分析和复杂查询。但OLAP能满足上述要求。OLAP与OLTP紧密联系,OLAP使用的数据由OLTP产生,而OLTP自动化的业务流程是由OLAP提供决策支持。

以上梳理了olap的定义及其和oltp的区别与联系,希望对你有所帮助,如果你想了解更多相关内容,敬请关注三个皮匠报告的行业知识栏目。
推荐阅读:
奇点云:OLAP数据库引擎选型白皮书(2022)(18页).pdf
【研报】通信行业海外云相关行业简析之Snowflake:全球领先云上数据仓库-20200921(27页).pdf
汽车及零部件行业数据仓库系列:汽车零部件数据跟踪建议关注空气悬架、全景玻璃车顶及HUD渗透率低且成长空间显著-211011(20页).pdf