当前位置: 首页 > news >正文

网站维护要做哪些工作网站首页原型图

网站维护要做哪些工作,网站首页原型图,泉州网站制作,网站设计的难点1:为什么要分层 大多数情况下,我们完成的数据体系却是依赖复杂、层级混乱的。在不知不觉的情况下,我们可能会做出一套表依赖结构混乱,甚至出现循环依赖的数据体系。 我们需要一套行之有效的数据组织和管理方法来让我们的数据体系…

1:为什么要分层

大多数情况下,我们完成的数据体系却是依赖复杂、层级混乱的。在不知不觉的情况下,我们可能会做出一套表依赖结构混乱,甚至出现循环依赖的数据体系。

我们需要一套行之有效的数据组织和管理方法来让我们的数据体系更有序,这就是谈到的数据分层。数据分层并不能解决所有的数据问题。

2:数仓的三层结构

我们将数据模型分为三层:数据运营层( ODS )、数据仓库层(DW)和数据应用层/应用数据存储(APP/ADS)
ODS层存放的是接入的原始数据
DW层是存放我们要重点设计的数据仓库中间层数据
APP/ADS是面向业务定制的应用数据。

1、数据运营层:ODS(Operational Data Store)

“面向主题的”数据运营层,也叫ODS层,是最接近数据源中数据的一层,数据源中的数据,经过抽取、洗净、传输,也就说传说中的 ETL 之后,装入本层。本层的数据,总体上大多是按照源头业务系统的分类方式而分类的。
一般来讲,为了考虑后续可能需要追溯数据问题,因此对于这一层就不建议做过多的数据清洗工作,原封不动地接入原始数据即可,至于数据的去噪、去重、异常值处理等过程可以放在后面的DWD层来做。

2、数据仓库层:DW(Data Warehouse)

数据仓库层是我们在做数据仓库时要核心设计的一层,在这里,从 ODS 层中获得的数据按照主题建立各种数据模型。DW层又细分为 DWD(Data Warehouse Detail)层、DWM(Data WareHouse Middle)层和DWS(Data WareHouse Servce)层。

1)数据明细层:DWD(Data Warehouse Detail)

该层一般保持和ODS层一样的数据粒度,并且提供一定的数据质量保证。同时,为了提高数据明细层的易用性,该层会采用一些维度退化手法,将维度退化至事实表中,减少事实表和维表的关联。 另外,在该层也会做一部分的数据聚合,将相同主题的数据汇集到一张表中,提高数据的可用性。

2)数据中间层:DWM(Data WareHouse Middle)

该层会在DWD层的数据基础上,对数据做轻度的聚合操作,生成一系列的中间表,提升公共指标的复用性,减少重复加工。 直观来讲,就是对通用的核心维度进行聚合操作,算出相应的统计指标。

3)数据服务层:DWS(Data WareHouse Servce)

又称数据集市或宽表。按照业务划分,如流量、订单、用户等,生成字段比较多的宽表,用于提供后续的业务查询,OLAP分析,数据分发等。
一般来讲,该层的数据表会相对比较少,一张表会涵盖比较多的业务内容,由于其字段较多,因此一般也会称该层的表为宽表。

3、数据应用层:APP(Application)/ADS

在这里,主要是提供给数据产品和数据分析使用的数据,一般会存放在 ES、PostgreSql、Redis等系统中供线上系统使用,也可能会存在 Hive 或者 Druid 中供数据分析和数据挖掘使用。比如我们经常说的报表数据,一般就放在这里。

3:总结及其他

ODS层: 源数据层作用: 对接数据源, 和数据源的数据保持相同的粒度(将数据源的数据完整的拷贝到ODS层中)注意:如果数据来源于文本文件, 可能会需要先对这些文本文件进行预处理(spark)操作, 将其中不规则的数据, 不完整的数据, 脏乱差的数据先过滤掉, 将其转换为一份结构化的数据, 然后灌入到ODS层一般放置 事实表数据和少量的维度表数据DW层:  数据仓库层DWD层: 明细层作用: 用于对ODS层数据进行清洗转换工作 , 以及进行少量的维度退化操作少量: 1) 将多个事实表的数据合并为一个事实表操作2) 如果维度表放置在ODS层 一般也是在DWD层完成维度退化DWM层: 中间层    作用:  1) 用于进行维度退化操作  2) 用于进行提前聚合操作(周期快照事实表)DWS层: 业务层    作用: 进行细化维度统计分析操作DA层:  数据应用层作用: 存储基于DWS层再次分析的结果, 用于对接后续的应用(图表, 推荐系统...)例如:比如DWS层的数据表完成了基于订单表各项统计结果信息,  但是图表只需要其中销售额, 此时从DWS层将销售额的数据提取出来存储到DA层DIM层: 维度层作用: 存储维度表数据


 

http://www.yayakq.cn/news/854318/

相关文章:

  • 做推广最好的网站是哪个?陕西省档案馆建设网站
  • 什么是网站制作appwordpress 侧栏 位置
  • 北京网站建设哪家便宜平面设计软件有哪些好用
  • 用ip访问没有备案的网站宣传推广方案怎么写模板
  • 龙港哪里有做百度网站的搜索引擎优化百度百科
  • 网站建设实验总结百科做网站用jquery
  • 提供网站建设空间网站内链seo
  • 装饰公司网站php源码房管网查询中心
  • 网站后台更改首页代码河北省建设厅网站查询中心
  • dw做音乐网站商城网站建设价格
  • 我的世界做外国壁纸网站网站规划和网站建设
  • 杭州下沙做网站的论坛软件工程项目开发流程
  • 厦门电子商务网站建设少儿编程培训机构哪里好
  • 做网站卖游戏装备wordpress新闻类主题
  • 网站程序开发素材模板网站
  • 做网站建设的方案上饶建设局网站
  • wordpress 建站赚钱无锡装饰网站建设
  • 龙岩网站排名wordpress的链接
  • 网站开发目的简介长沙调查公司
  • 网站建设每天的工作静态网站结构如何更新
  • 做网站找个人还是公司哪个网站做系统好
  • 网站区域名怎么注册湖南省建设安监局官网站
  • 网站的照片上传的功能怎么做济南seo怎么优化
  • 沈阳网站建站江西建设监理协会网站
  • 登录建设部网站微信导航网站模板
  • 网站推广的目标是什么中国公司排名500强
  • 电子商务建立网站前期准备电子商务营销是什么意思
  • 手机建设中网站鹿城网络公司
  • 网站专题方案网站服务器免费申请
  • 用什么软件搭建网站源码python语言变量命名规则