当前位置: 首页 > news >正文

网站建设系统认证系统湖北外贸网站建设

网站建设系统认证系统,湖北外贸网站建设,如何做像淘宝一样的网站,云计算存储网站建设安全Hive是工作中常用的数据仓库工具,提供存储在HDFS文件系统,将结构化数据映射为一张张表以及提供查询和分析功能。 Hive可以存储大规模数据,但是在运行效率上不如传统数据库,这时需要懂得常见场景下提升存储或查询效率的方法&#x…

Hive是工作中常用的数据仓库工具,提供存储在HDFS文件系统,将结构化数据映射为一张张表以及提供查询和分析功能。
Hive可以存储大规模数据,但是在运行效率上不如传统数据库,这时需要懂得常见场景下提升存储或查询效率的方法,本文记录工作中常见的情形。

map阶段优化

map阶段主要是把文件拆分成一个个文件块。正常情况下,一个map任务的启动和初始化时间远远大于逻辑处理时间,所以可以增大max参数值减少map数;但在计算逻辑较为复杂(字段少记录过多)时可以减少max参数值增大map数,控制map数来协调启动和逻辑处理时间。

-- 减少map数
set hive.hadoop.supports.splittable.combineinputformat=true;
set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat; -- 执行前进行小文件合并,进而减少map数目
-- 文件小于1M的会单独产生一个map,文件在1M-256M之间大小的会合并,文件大于256M的拆分为多个
set mapred.min.split.size=1000000;
set mapred.max.split.size=256000000;
set mapred.min.split.size.per.node=256000000;
set mapred.min.split.size.per.rack=256000000;
-- set hive.exec.reducers.bytes.per.reducer=1073741824; -- 控制reduce个数,超过文件大小会产生多个reduce任务-- 增大map数
-- 一般使用情况是文件不是特别大,但是计算逻辑复杂,计算比较耗时,那么可以强制指定一个map任务个数提高执行效率
set mapred.reduce.tasks=10;
reduce阶段优化

reduce个数决定了最终输出文件的个数。增大reduce的个数会增加输出文件数量,减小reduce个数会减少输出文件数量。reduce个数过多会产生很多小文件影响以后计算效率,reduce个数过少会造成单个reduce处理数据量过大影响效率。

-- 1、Hive自动计算reduce个数
set hive.exec.reducers.bytes.per.reducer=500000000; -- 每个reduce任务最多处理500M的数据
set hive.exec.reducers.max=1009; -- 每个任务的最大reduce个数-- 2、认为指定reduce个数
set mapred.reduce.tasks=10; -- 人为指定10个reduce,会产生10个文件

注意,会产生只有一个reduce的情况:

  1. 查询时使用了order by 全局排序
  2. 表关联join时产生笛卡尔积情况
源头建表优化

建表时可以指定文件压缩格式,不要使用textfile,一般可以使用parquet+snappy格式

-- 为了提高计算和存储效率
ROW FORMAT SERDE
'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
STORED AS INPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat'
TBLPROPERTIES('parquet.compression'='SNAPPY')
http://www.yayakq.cn/news/397012/

相关文章:

  • 天津做胎儿鉴定网站net的电商网站建设
  • 品牌网站建设gs专业招牌制作公司
  • 做网站单位不动产认证是哪个公司做的网站
  • 工具网站有哪些sspai 少数派wordpress
  • 做英语手抄报 什么网站长沙外贸建站
  • 网站flash效果棋牌游戏网站建设
  • 足球亚洲排名最新排名关键词排名优化报价
  • 口红机网站怎么做中国十大证券公司排名
  • 怎样加入装修接单网站做卖车网站需要什么手续费
  • 有那个网站可以做食品台账wordpress调用文章标签
  • 研究生做家教什么网站3000ok新开传奇网站公益服
  • 宁波网站建设优化企业推荐asp网站的配置
  • 天津网站搜索优化河北工程大学最新消息
  • 营销网济宁seo优化公司
  • 包头网站网站 备案号查询
  • 广州三合一网站建设wordpress非官方
  • app网站如何做推广方案网站如何能吸引用户
  • 如何生成一个网站毕业设计做网站简单吗
  • 官方网站怎样做wordpress悬浮导航栏
  • 全国设计师网站台州椒江做网站
  • 网站开发交接运营推广是做什么的
  • 无锡新吴区住房建设和交通局网站WordPress phpspider
  • 公司的网站备案p9制作公司
  • 西安网站建设云阔网络熊掌号上海网站开发建设电话
  • 佛山网站建设公司3luewordpress 默认搜索引擎
  • 学校网站报价单网站建设优化石家庄
  • wordpress多站点不同主题wordpress模板制作
  • 深圳网站建设三把火免费公司网站建设
  • 网站建设的重要性与价值本地生活网
  • 安微省建设厅网站合肥官方网站优化费用