当前位置: 首页 > news >正文

青岛低价网站建设合肥有没有做网站的单位

青岛低价网站建设,合肥有没有做网站的单位,品牌视觉设计包含什么,网站ico设计数仓 拉链表 按天全量打宽性能优化现状描述优化现状描述 1、业务历史数据可以变更 2、拉链表按天打宽 3、拉链表模型分区字段设计不合理,通用的过滤字段没有作为分区分桶字段 4、拉链表表数据量略大、模型数据分区不合理和服务器资源限制,计算任务执行超…

数仓 拉链表 按天全量打宽性能优化

  • 现状描述
  • 优化

现状描述

1、业务历史数据可以变更
2、拉链表按天打宽
3、拉链表模型分区字段设计不合理,通用的过滤字段没有作为分区分桶字段
4、拉链表表数据量略大、模型数据分区不合理和服务器资源限制,计算任务执行超时【3-4年,用户数:132W】
5、基于拉链表打宽后的天表行转列【最多列达到300列】,sum(case when … end),没有提前过滤数据

优化

1、完善模型设计,设计主键和分桶字段

1)在单表计算:若大表存放多种类型数据,数据分类字段要做为分区或分桶字段,可以实现数据快速过滤
2)多表关联:在大表合理设置了主键、分区或分桶的前提下,建议把关联字段做份分区或分桶字段【要综合考虑验证,设置过多分区分桶字段可能也会影响数据性能】

2、提前进行数据过滤和分级分类计算
前提:拉链表数据量较大或打宽后数据量较大

1)若拉链表数据量较大且包含多种类型数据,需要进行打宽表处理【一条打宽成多条】,那么打宽表后的数据量会翻几倍甚至更多从而导致性能很慢或者执行超时;
》》》建议1:在打宽的过程中按类别均匀拆分数据打宽到多个临时表
》》》建议2:增加任务并行度【在资源允许的前提下,大部分任务提高并发度可以解决性能问题:set parallel_fragment_exec_instance_num=8;】2)若拉链表数据量较大【同一种类型数据】,需要进行打宽表处理【一条打宽成多条】,那么打宽表后的数据量会翻几倍甚至更多从而导致性能很慢或者执行超时;
》》》建议1:在打宽的过程中可以按时间拆分为当前和历史数据表【数据归档处理】
》》》建议2:增加任务并行度【在资源允许的前提下,大部分任务提高并发度可以解决性能问题:set parallel_fragment_exec_instance_num=8;】

3)若拉链表打宽后不同类型数据在下游计算逻辑不一致,建议根据数据类型或其他类型拆分数据

在这里插入图片描述
3、根据指标需求进行热点数据特殊优化
前提:资源有限,1个并发度运行

1)拉链表按分类拆分【过滤】后再按天打宽到多个宽表;
2)计算逻辑:计算第1-150天和150+的数据,打宽成151行;
》》》可以分两类计算:第一类计算第1-150天【150列】再关联计算150+列
3)若按以上逻辑计算任务还是执行超时,把数据拆分当前表和历史表,使用两个insert 
http://www.yayakq.cn/news/851332/

相关文章:

  • 淘宝客推广怎么做网站备案太原制作微信网站
  • 半路出家去学计算机网站开发wordpress 侵权
  • 免费做暧暧网站sem是什么牌子
  • 网站运营与管理论文手机百度免费下载
  • 营销式网站建设公司怎么解决
  • 电子商务网站建设第三章答案做网站工作都包括什么
  • 建设官网的网站首页ih5 做视频网站
  • 重庆微网站建设前端开发就是做网站吗
  • 太原建站模板搭建破解版成年猫咪版永久
  • 如何买网站公众号下载wordpress
  • seo蒙牛伊利企业网站专业性诊断网站页面布局名称
  • 南阳网站排名公司基于jsp网站开发
  • 如何做网站数据报表erp软件是什么意思
  • 通信网站建设WordPress博客主题免费
  • 禹州做网站的python flask做网站
  • 开一个做网站的公司赚钱吗百度竞价托管代运营公司
  • 网页设计与网站建设...医院如何做网站策划
  • 烟台网站建设多少钱山东省中国建设银行网站
  • 内容转载的网站怎么做工作作风方面存在的问题及整改措施2023
  • 网站seo系统阿里邮箱登录入口
  • 网站qq在线代码电子制作网站
  • 河南小学网站建设cc0图片素材网站
  • 郑州正云网站建设外贸高端网站建设
  • 网站怎么弄缩略图上传黄骅市企业名录
  • 无锡高端网站设计公司价格网页设计与网站架设
  • 南京专业网站设计公司中小企业网络工程建设
  • 影响网站速度的代码qq邮箱登录手机版网页
  • 广西城乡建设网站床上用品网站源码
  • 公司网站开发建设免费流量网站推广
  • 织梦摄影网站模板html如何做购物网站