当前位置: 首页 > news >正文

银川公司网站建设网站广告位制作

银川公司网站建设,网站广告位制作,湖北建设厅考试网站,合肥网站营销1.数据预处理 根据自己或者学校系统预制的数据 使用less sogou.txt可查看 wc -l sogou.txt 能够查看总行数 2.数据扩展部分 我的数据位置存放在 /data/bigfiles 点击q退出 将一个文件的内容传递到另一个目录文件下 原数据在 /data/bigfiles ->传递 到/data/workspac…

1.数据预处理

根据自己或者学校系统预制的数据

使用less sogou.txt可查看

wc -l sogou.txt 能够查看总行数

2.数据扩展部分

我的数据位置存放在 /data/bigfiles

点击q退出

将一个文件的内容传递到另一个目录文件下

原数据在 /data/bigfiles  ->传递 到/data/workspace

awk -F '\t' '{print $0 "\t" substr($1,1,4) "\t" substr($1,5,2) "\t" substr($1,7,2) "\t" substr($1,9,2)}' /data/bigfiles/sub_sogou.txt>/data/workspace/sub_sogou-ext.txt

继续使用less命令可以查看数据扩展结果

3.数据加载

将数据加载到HDFS

hdfs dfs -mkdir -p /sogou/20111230

hdfs dfs -put /data/workspace/sub_sogou.txt /sogou/20111230

hdfs dfs -mkdir -p /sogou_ext/20111230

hdfs dfs -put /data/workspace/sub_sogou.txt /sogou_ext/20111230

 基于Hive构建日志数据的数据仓库

要记得启动hive

接下来的操作均在hive客户端完成

1.基本操作

查看数据库的命令:show databases;

创建数据库sogou:create database if not exists sogou;

接下来使用数据库:use sogoul

查看表名:show tables;

创建外部表sogou_22106128用于加载sogou.txt的数据

CREATE EXTERNAL TABLE sogou.sogou_22106128 (ts STRING,uid STRING,keyword STRING,rank INT,order_num INT, url STRING
)
COMMENT 'This is the sogou search data of one day'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE
LOCATION '/sogou/22106128';

 desc sogou_22106128可查看相关字段和类型

2.创建分区(按照年、月、日、小时)

创建四个字段数据的外部表

CREATE EXTERNAL TABLE sogou.sogou_ext_22106128 (ts STRING,uid STRING,keyword STRING,rank INT,order1 INT, url STRING,year INT,month INT,day INT,hour INT
)
COMMENT 'this is the sogou search data of extend'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t' 
STORED AS TEXTFILE
LOCATION '/sogou_ext/22106128'; 

 创建好后创建分区表:

CREATE EXTERNAL TABLE sogou.sogou_partition (ts STRING,uid STRING,keyword STRING,rank INT,order1 INT, url STRING
)
PARTITIONED BY (year INT, month INT, day INT, hour INT)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'  
STORED AS TEXTFILE
LOCATION '/path/to/sogou_partition'; 

 最后向分区表sogou_partition中载入数据:

set hive.exec.dynamic.partition.mode=nonstrict; //开启动态分区模式为非严格的

这部分参考的老师的代码:

 

http://www.yayakq.cn/news/77641/

相关文章:

  • 山西项目网网站优化建设绵阳
  • 青海省wap网站建设公司建设行业网站大概需要都少钱
  • 左中右三栏布局网站建设唐山哪里做网站
  • 网站好坏的指标重庆餐饮网站建设
  • 烟台网站建设网站推广wordpress调用分类文章列表
  • 做网站判多少年常州钟楼建设局网站
  • 2013电子商务网站建设考试长沙做网站设计公司
  • 梨树县交通建设网站最简单制作网页
  • 上海网站建设|网站制作和女的做那个视频网站
  • 地图网站模板网络规划设计师报考多少钱
  • gta5买房子网站建设网站建设的设立方式
  • 莆田建设银行官方网站手机软件商店
  • 做网站改字号代码张楚岚
  • lookae素材网上海关键词优化
  • 苏州前几天网站建设自主建网站
  • 广州 海珠 建网站竞价培训
  • 网站建设运营怎么办茂名网站建设电话
  • 陕西公路工程建设有限公司网站福建泉州网站建设公司
  • html建设网站免费的企业建站系统
  • 哪些网站可以做百科参考资料教育培训网站建设方案模板下载
  • 广宁网站建设专业做网站建设公司
  • 快速建站套餐wordpress0基础
  • 硅胶科技东莞网站建设车牌照丢失能在网站做吗
  • 网站开发 手把手文创产品设计ppt
  • 甘肃建设厅官方网站项目负责人湛江网站seo推广
  • 服务器做网站国内建站平台有哪些
  • 培训行业网站建设是什么商丘百度推广公司地址
  • 网站建设公司收费服务器域名查询
  • 石家庄站在哪个区百度识图网页入口
  • 专业做网站设计wordpress 批量发布器