当前位置: 首页 > news >正文

建立一个网店网站营销型网站建设哪里济南兴田德润优惠吗

建立一个网店网站,营销型网站建设哪里济南兴田德润优惠吗,2021可以访问黄的浏览器,装修免费出效果图shuffle流程概括 因为频繁的磁盘I/O操作会严重的降低效率,因此“中间结果”不会立马写入磁盘,而是优先存储到Map节点的“环形内存缓冲区”,在写入的过程中进行分区(partition),也就是对于每个键值对来说&a…

shuffle流程概括

因为频繁的磁盘I/O操作会严重的降低效率,因此“中间结果”不会立马写入磁盘,而是优先存储到Map节点的“环形内存缓冲区”,在写入的过程中进行分区(partition),也就是对于每个键值对来说,都增加了一个partition属性值,然后连同键值对一起序列化成字节数组写入到缓冲区(缓冲区采用的就是字节数组,默认大小为100M)。当写入的数据量达到预先设置的阙值后(MapReduce.Map.io.sort.spill.percent,默认0.80,或者80%)便会启动溢写出线程将缓冲区中的那部分数据溢出写(spill)到磁盘的临时文件中,并在写入前根据key进行排序(sort)和合并(combine,可选操作)。溢出写过程按轮询方式将缓冲区中的内容写到MapReduce.cluster.local.dir属性指定的目录中。当整个Map任务完成溢出写后,会对磁盘中这个Map任务产生的所有临时文件(spill文件)进行归并(merge)操作生成最终的正式输出文件,此时的归并是将所有spill文件中的相同partition合并到一起,并对各个partition中的数据再进行一次排序(sort),生成key和对应的value-list,文件归并时,如果溢写文件数量超过参数min.num.spills.for.combine的值(默认为3)时,可以再次进行合并。至此,Map端shuffle过程结束,接下来等待reduce task来拉取数据。对于reduce端的shuffle过程来说,reduce task在执行之前的工作就是不断地拉取当前job里每个Map task的最终结果,然后对从不同地方拉取过来的数据不断地做merge最后合并成一个分区相同的大文件,然后对这个文件中的键值对按照key进行sort排序,排好序之后紧接着进行分组,分组完成后才将整个文件交给reduce task处理。

分区是发生在溢出写过程之前,也就是当满足溢出写条件时,首先进行分区,然后分区内排序,并且选择性的combine,最后写出到磁盘。

【Reducer如何知道自己应该处理哪些数据】

因为Map端进行partition的时候,实际上就相当于指定了每个Reducer要处理的数据(partition就对应了Reducer),所以Reducer在拷贝数据的时候只需拷贝与自己对应的partition中的数据即可。每个Reducer会处理一个或者多个partition。

【Reducer如何知道要从哪台机器上去的Map输出】

Map任务完成后,它们会使用心跳机制通知它们的Application Master、因此对于指定作业,Application Master知道Map输出和主机位置之间的映射关系。Reducer中的一个线程定期询问Master以便获取Map输出主机的位置。知道获得所有输出位置。

http://www.yayakq.cn/news/730479/

相关文章:

  • 网站目标建设国际国内时事
  • 天元建设集团有限公司资质长沙seo优化排名推广
  • 网站建设终端是什么如何做制作头像的网站
  • wang域名 网站能帮忙做网站建设
  • l临沂互助系统网站开发张家港哪家做企业网站
  • 网站怎么建设高端公司山东网站备案网站
  • 网站建设课程设计心得网页制作东莞
  • 梁山做网站的公司瑞安地区建设网站
  • vue做的手机网站制作招聘海报的app
  • 网站建设首选建站系统应遵循哪些原则
  • 无锡的网站建设公司中国常州网官网
  • 网站泛解析wordpress是mvc架构吗
  • 怎么写网站文案音乐门户网站模板
  • wordpress创建企业网站建设部网站官网查询
  • 做网站工资年新多少在广东烟台网站建设策划方案
  • 潍坊网站建设 潍坊做网站网站制作加教程视频
  • 做笑话网站做网站的什么行业好出单
  • 东莞如何搭建网站建设知更鸟wordpress 怎样
  • 学校网站建设开发微网站备案
  • 分析不同网站的优缺点网站 dns 解析
  • 怎样做网站瑞昌网站建设
  • 扬中网站网站建设给帅哥做奴视频网站地址
  • 电子商务网站策划书2000字无备案网站 阿里联盟
  • 做网站卖专业卖文玩wordpress5.0代码执行
  • 全屏背景网站如何做到自适应wordpress博
  • 如何跟客户介绍网站建设和推广wordpress获取文章发布时间
  • 广东省建设合同备案网站西双版纳建设局网站
  • 网站开发用盗版犯法网站内容分享
  • 生产型或服务型企业网站有哪些做贷款网站
  • 宁波网站建设官网自己怎么做网站网页