- 商业智能报表:BI报表。
- ETL:全称 Extract-Transform-Load,即提取(extract)、转换(transform)、加载(load)。
E是第一步对源数据进行抽取,源数据主要来源于业务系统、文件数据、第三方数据。T是第二步,对数据进行适当处理,目的是为了下一步的加载。主要是筛选(有价值数据)、清理(异常数据)、转换(如时间、数字、小数等)、缺失值填充、默认值设定、枚举值映射、数据拆分、合并、排序、计算等。T是第三步,将经过适当处理的数据加载到数据仓库中,分为全量加载、增量加载,这是是一个周期性的、不断完善的工作。文章来源地址https://www.toymoban.com/news/detail-847402.html
- DW:数据仓库(data warehouse),企业的数据存储集合。可以有多种用途,如做报表、BI报告、其他的分析功能。可存储历史数据、可根据主题有不同的组织形式等。
- OLAP和OLTP:OLAP是联机分析处理(On-Line Analytical Processing),OLTP是联机事务处理(on-line transaction processing)。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
- 建立一个BI报表需要经过ETL、DW、OLAP及数据可视化4个阶段。
- OLAP技术是关键,包含两步:1 创建多维数据模型,2 创建针对度量的汇总规则。
- 多维数据模型中的维度在分析过程中代表业务角度。
- 多维数据模型又称多维数据集或立方体,将DW中的多源数据连接到一起,解决“信息孤岛”问题。
- 数据分析领域有两种类型建模:一是搭建多维数据模型,二是建立分析所需的数学模型。
- 创建多维数据模型的过程就是在多个不同的数据表间进行连接的过程。连接使用公共字段。连接时星号(*)代表多表,1代表一表。连接线中的箭头代表筛选器,双向箭头代表双向筛选。影响连接汇总结果的因素:筛选器的方向、对应关系、汇总角色。
- 透视分析的本质就是维度字段对度量字段的的汇总计算。汇总的时候通过1表出维度字段,多表出度量字段,如果相反会造成汇总错误。
文章来源:https://www.toymoban.com/news/detail-847402.html
到了这里,关于(CDA数据分析师学习笔记)第五章多维数据透视分析一的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!