当前位置: 首页 > news >正文

瑞安网站建设成都古怪科技网站建设公司

瑞安网站建设,成都古怪科技网站建设公司,网页制作简明教程,做网站的项目实施方案文章目录 1. 准备数据文件2. 文件上传到HDFS指定目录2.1 创建HDFS目录2.2 上传文件到HDFS2.3 查看上传的文件 3. 运行词频统计程序的jar包3.1 查看Hadoop自带示例jar包3.2 运行示例jar包里的词频统计 4. 查看词频统计结果5. 在HDFS集群UI界面查看结果文件6. 在YARN集群UI界面查…

文章目录

  • 1. 准备数据文件
  • 2. 文件上传到HDFS指定目录
    • 2.1 创建HDFS目录
    • 2.2 上传文件到HDFS
    • 2.3 查看上传的文件
  • 3. 运行词频统计程序的jar包
    • 3.1 查看Hadoop自带示例jar包
    • 3.2 运行示例jar包里的词频统计
  • 4. 查看词频统计结果
  • 5. 在HDFS集群UI界面查看结果文件
  • 6. 在YARN集群UI界面查看程序运行状态
  • 7. 失败状态原因分析与解决

在这里插入图片描述

1. 准备数据文件

首先,我们需要在Hadoop集群的主节点上准备数据文件,用于词频统计MapReduce作业。

  • 在master云主机上创建一个名为 test.txt 的文件。

2. 文件上传到HDFS指定目录

接下来,我们将本地文件系统上的数据文件上传到HDFS的指定目录。

2.1 创建HDFS目录

  • 执行命令:hdfs dfs -mkdir -p /wordcount/input 来创建HDFS目录。

2.2 上传文件到HDFS

  • 执行命令:hdfs dfs -put test.txt /wordcount/input 来上传文件。

2.3 查看上传的文件

  • 执行命令:hdfs dfs -ls /wordcount/input 来查看目录中的文件。
  • 执行命令:hdfs dfs -cat /wordcount/input/test.txt 来查看文件内容。
  • 也可以通过Hadoop WebUI界面来查看文件。

3. 运行词频统计程序的jar包

我们将使用Hadoop自带的示例jar包来运行词频统计程序。

3.1 查看Hadoop自带示例jar包

  • 切换到MR示例目录:执行命令 cd $HADOOP_HOME/share/hadoop/mapreduce
  • 列出目录信息:执行命令 ls
  • 找到示例程序jar包:hadoop-mapreduce-examples-3.3.4.jar

3.2 运行示例jar包里的词频统计

  • 执行命令:hadoop jar ./hadoop-mapreduce-examples-3.3.4.jar wordcount /wordcount/input/test.txt /wordcount/output 来运行词频统计程序。

4. 查看词频统计结果

  • 执行命令:hdfs dfs -ls /wordcount/output 来查看结果文件。
  • 执行命令:hdfs dfs -cat /wordcount/output/* 来查看词频统计的结果内容。

5. 在HDFS集群UI界面查看结果文件

  • 通过HDFS集群UI界面查看 /wordcount/output 目录下的文件。

6. 在YARN集群UI界面查看程序运行状态

  • 在浏览器中访问 http://master:8088 来查看YARN集群的界面。
  • 观察应用程序的运行状态,例如 application_1728606339394_0001

7. 失败状态原因分析与解决

如果作业失败,可能是因为 mapred-site.xml 文件中没有配置必要的环境变量。

  • 配置必要的环境变量:
    <configuration><!-- 配置项 --><property><name>mapreduce.framework.name</name><value>yarn</value></property><property><name>yarn.app.mapreduce.am.env</name><value>HADOOP_MAPRED_HOME=/usr/local/hadoop-3.3.4</value></property><property><name>mapreduce.map.env</name><value>HADOOP_MAPRED_HOME=/usr/local/hadoop-3.3.4</value></property><property><name>mapreduce.reduce.env</name><value>HADOOP_MAPRED_HOME=/usr/local/hadoop-3.3.4</value></property>
    </configuration>
    
  • 修改配置后,需要将配置分发到所有节点,并重启Hadoop服务。

通过以上步骤,我们完成了一个词频统计的MapReduce作业,从准备数据到运行作业,再到查看结果。这个过程展示了Hadoop MapReduce作业的基本流程和一些常见的配置问题及其解决方法。

http://www.yayakq.cn/news/42569/

相关文章:

  • 怎么用ps做网站首页背景图片正能量网站免费入口不用下载
  • 那里可以做工作室做网站静态网页设计报告
  • 做五金生意什么网站做比较好金坛区住房城乡建设局网站
  • 许昌网站优化html网页搭建
  • 提供网站建设工具的品牌三网合一网站建设方案
  • 企业品牌网站建设价格网站开发前端兼职
  • 做网站的搜索引擎彩票网站维护会跑路吗
  • 店铺推广方案怎么写seo课程培训要多少钱
  • 沈阳网站建设小工作室怎样营销能有效获取客户
  • 做网站主播要什么条件网站托管服务怎么收费
  • 京东网站建设策划书高端网站建设高端网站建设专家
  • 我有网站 怎么做淘宝推广做网站一般按什么报价
  • 天津做网站设计公司人力资源网站开发说明书
  • 网站建设合同交印花税么网站一般用什么架构
  • 南京建设企业网站黑马网站建设
  • 网站开发人员的前景wordpress建站 博客
  • 小白学做搭建网站房产资讯什么网站做的好
  • 电脑买编程代码做网站酒店的网络营销是什么
  • 福州建设人才网站合肥制作网页设计
  • 做网站详细教程汽车之家电脑网页版
  • 太原企业网站制作百度域名查询
  • 中国建设银行假网站网页版传奇工作室
  • 建设一个旅游电子商务网站php语言网站开发公司北京
  • 网站备案多个域名网站优化推广软件
  • 贡嘎网站建设上海网络推广专员招聘
  • 做运营的网站品牌全案策划案例
  • 网上停车场做施工图人员网站企业风首页中文官网模板
  • 世界经理人网站手机版织梦怎么做淘客网站
  • 手机可以制作网站吗模板网站建设服务商
  • 昌平做网站受欢迎的网站建设案例