当前位置: 首页 > news >正文

自助建站系统开发网站后台编辑器控件下载

自助建站系统开发,网站后台编辑器控件下载,wordpress插件 登录,cd网站建设#1.数据倾斜 什么是数据倾斜? 一部分数据多 一部分数据少 造成的结果: MR运行过慢 主要是shuffle和reduce过程慢 分组聚合导致数据倾斜 Hive未优化的分组聚合 方法1:在MAP端直接聚合(分组聚合优化),减少…

#1.数据倾斜
什么是数据倾斜?
一部分数据多
一部分数据少
造成的结果: MR运行过慢 主要是shuffle和reduce过程慢

分组聚合导致数据倾斜

Hive未优化的分组聚合
在这里插入图片描述
方法1:在MAP端直接聚合(分组聚合优化),减少Key
MR失败

方法2:随机数,按随机数放入reduce中 解决数据倾斜 第二个Jobs按分组字段分区
因为生成随机了,所以按

方法1和方法2 一起用是不影响的
先进行聚合 然后按随机数分配reduce 再启动一个job dierge job 按分组字段分区

join的数据倾斜
最后根据KEY进行分组
在这里插入图片描述
这里的数据倾斜的现象和影响是什么呢?
1.map join
2. skew join
牺牲一个job为代价解决
将产生数据倾斜的Key去单独跑一个job
其实就是啥, map将大K提出来重新一个job ,剩下的直接生成结果集,然后job2的结果最后也注入结果集
根据参数判断
在这里插入图片描述
这里晚点多看一下
大表Join 对倾斜Key的表的key打散,对关联的另一张表的key扩容
为什么????

reduce 并行度
可以指定并行度,也可以自动
可以设置最大值
为什么最大默认1009
在这里插入图片描述

可以设置reduce task数据量 估算Reduce并行度

reduce task量与数据量相关合理么?
不合理,因为收到的是map处理后的数据,有可能已经变小很多了,在reduce端小文件
但是无法获取map的数据量

在这里插入图片描述
3表join OBC如何优化?
在这里插入图片描述
在这里插入图片描述
优化后: 先进行小表合并,

谓词下推
谓词下推(predicate pushdown)是指,尽量将过滤操作前移,以减少后续计算步骤的数据量。
CBO优化也会完成一部分的谓词下推优化工作,因为在执行计划中,谓词越靠前,整个计划的计算成本就会越低。
–是否启动谓词下推(predicate pushdown)优化
set hive.optimize.ppd = true;
白话:
在这里插入图片描述
谓词下推:先执行过滤条件再执行join

在这里插入图片描述

hive本地模式
在这里插入图片描述
开启自动转换模式
符合条件用本地 不符合条件用集群
与直接设置HADOOP参数语句的不同
一个自动,一个主动。

set mapreduce.framework.name=local;
http://www.yayakq.cn/news/587602/

相关文章:

  • 做商城网站的报名网站开发多钱
  • 漳州 做网站2022手机能看的你们知道
  • 佛山网站设计制作免费咨询职高门户网站建设标准
  • 湘潭网络公司网站建设网络营销的成功案例分析
  • 莆田有哪些网站建设公司网站外链建设与文章发布规范
  • 建个公司网站多少钱网站建设普及型
  • 北京企业展示网站建设wordpress 加轮播图
  • 建站工具也成为什么系统destoon做的网站
  • 做不锈钢门的网站青岛网站建设哪个好
  • 免费视频网站制作网站建设与优化推广方案
  • 西安建站软件东莞大朗现在有多少例
  • 手机版企业网站制作app软件工具下载
  • 扬州公司网站建设手机网站开发屏幕尺寸一般是多少
  • 如何在各网站做推广百度运营平台
  • 竟标网站源码做怎么网站
  • 网站建设的硬件支持影楼网站源码php
  • 顺德建设网站多少钱开发网站的软件
  • 网站有限公司免费自助网站制作
  • 如果做网站推广wordpress 盈利模式
  • 网站站长工具个人简历模板范文手写
  • 申请微信支付公司网站wordpress中文章
  • 知名做网站哪家好我在学校志愿队做网站的经历
  • 内网建站工具建公司网站的详细步骤
  • 南通高端网站建设富海人才招聘网官网
  • 做网站记者好吗google 网站优化工具
  • 广州购物商城网站免费咨询律师24小时电话
  • 常用知名购物网站一级消防工程师考试科目有哪些
  • 重庆开网站重庆网站建设jwzcq
  • 广州网站建设设计哪家好王府井网上商城官网
  • 源码建站之网站建设广州城市建设档案网站