当前位置: 首页 > news >正文

网站建设确认表企业网站的完整性包括哪些

网站建设确认表,企业网站的完整性包括哪些,哈尔滨网络公司网站建设,wordpress漏洞扫描1. InputFormat InputFormat是MapReduce框架提供的用来处理job输入的基类 它主要定义了三个功能: 1.验证job输入是否合法 2.对输入文件进行逻辑切片(InputSplit),然后将每个切片分发给单独的MapTask 3.提供切片读取器(Re…

1. InputFormat

InputFormat是MapReduce框架提供的用来处理job输入的基类
它主要定义了三个功能:
          1.验证job输入是否合法
          2.对输入文件进行逻辑切片(InputSplit),然后将每个切片分发给单独的MapTask
          3.提供切片读取器(RecordReader),用来读取切片中的数据

InputFormat作为抽象父类,只是定义了核心方法,根据具体的数据源类型和切片规则 MapReduce框架提供了很多功能子类

核心子类:
        DBInputFormat:将数据库中的数据作为MR程序的输入数据
        FileInputFormat:将hdfs或本地文件作为MR程序的输入数据

源码阅读:

package org.apache.hadoop.mapred;// InputFormat对象
public abstract class InputFormat<K, V> {TODO:1.将Mr程序输入的文件进行逻辑切分,并返回切片对象集合注意:1.这里的分割是逻辑分割,不是物理分割哦!!!public abstract List<InputSplit> getSplits(JobContext context) throws IOException, InterruptedException;TODO:1.为指定的切片对象,创建记录阅读器
public abstract RecordReader<K,V> createRecordReader(InputSplit split,TaskAttemptContext context) throws IOException, InterruptedException;
}// 切片对象
public class FileSplit extends InputSplit implements Writable {// 该切片 所属文件的路径private Path file;// 切片起始位置(文件偏移量)private long start;// 切片长度private long length;// 存储切片的hostsprivate String[] hosts;private SplitLocationInfo[] hostInfos;
}

2. FileInputFormat

FileInputFormat是当MR程序为hdfs或本地文件时,处理数据源的基类
它实现了很多具体方法,比如切片方法(getSplits)和isSplitable判断文件是否可切片

2.1 getSplits-切片规则

1.对job输入路径中的每个文件单独切片
2.判断每个文件是否支持切片
         true : 按照指定切片大小对文件切片
         false: 文件整体作为一个切片

2.2 怎样设置切片大小

// 切片大小计算规则
splitSize = Math.max(minSize, Math.min(maxSize, blockSize))// 切片大小设置参数
set mapreduce.input.fileinputformat.split.minsize=256000000 或 
set mapred.min.split.size=256000000set mapreduce.input.fileinputformat.split.maxsize=256000000 或 
set mapred.min.split.size=256000000//场景1: 没有设置minsize、maxsize参数
maxSize=Long.MAX_VALUE
minSize=1L
blockSize=本地目录32M|HDFS目录128M或256M(看hdfs文件块具体配置)splitSize=blockSize(32M|128M|256M)//场景2: 设置minsize、maxsize参数
maxSize=mapreduce.input.fileinputformat.split.maxSize
minSize=mapreduce.input.fileinputformat.split.minsize
blockSize=本地目录32M|HDFS目录128M或256M(看hdfs文件块具体配置)需求1: splitSize > blockSize
set mapreduce.input.fileinputformat.split.minSize=大于blockSize值需求2: splitSize < blockSize
set mapreduce.input.fileinputformat.split.maxSize=小于blockSize值

2.3 源码阅读

可以看之前写的例子 🌰


3. CombineFileInputFormat

转载1:  https://blog.csdn.net/hummingbird0/article/details/115084843

转载2:  https://blog.csdn.net/qq_35241080/article/details/106065442
 

http://www.yayakq.cn/news/861037/

相关文章:

  • 付网站建设费用会计分录手机上怎么设计广告图片
  • 建立网站一般包括什么等方式做一个网站的基本步骤
  • 赣榆城乡建设局网站网站建设会计科目
  • 网站排名带照片怎么做TP5企业网站开发教程百度云
  • 西安做网站哪家好局网站建设方案word
  • 网站制作哪家做的好电工培训机构
  • 网站如何自动手机版兴县网站建设
  • 做网站需要公司么兰州又发现一例
  • 如何制作网站教程wordpress集成当面付
  • 南充公司做网站seo下载站
  • 遵义网站设计济南网站建设 济南货梯
  • 怎么建立网站管理系统百度上怎么打广告宣传
  • 开发深圳网站建设创新创意设计作品
  • 简述网站建设的主要内容注册安全工程师报考时间2023
  • 怎么做自己网站的后台网站后台管理默认密码
  • 桂林网站优化互联网协会是干嘛的
  • 学校网站 源码个人作品展示网站模板
  • 如何注销网站备案负责人牛商网专注营销型网站建设
  • 平湖网站开发上海专业做网站价格
  • 曲靖网站网站建设网页设计作品展示模板
  • 网站建立明细预计表wordpress 英文模板
  • 关于做网站的调查问卷网站建设和seo的工作好不好
  • 餐饮酒店网站怎么做网站开发好的语言
  • 网站开发公司的网络设备互联课设建设企业网站
  • 天津网站建设制作系统家装网站建设公司哪家好
  • 网站建设是干嘛的重庆最新新闻头条
  • 大良网站制作公司互联网公司介绍
  • 专门做鞋子的网站有哪些百度搜索量最大的关键词
  • 烟台定制网站建设电话wordpress 分类表
  • 西安建设厅网站crm免费