当前位置: 首页 > news >正文

做电子元器件销售什么网站好在网上做兼职美工有哪些网站

做电子元器件销售什么网站好,在网上做兼职美工有哪些网站,兰州手机网站建设,云南建网站需要多少钱一、目的 在用Flume把Kafka的数据采集写入Hive的ODS层表的HDFS文件路径后,发现HDFS文件中没问题,但是ODS层表中字段的数据却有问题,字段中的JSON数据不全 二、Hive处理JSON数据方式 (一)将Flume采集Kafka的JSON数据…

一、目的

在用Flume把Kafka的数据采集写入Hive的ODS层表的HDFS文件路径后,发现HDFS文件中没问题,但是ODS层表中字段的数据却有问题,字段中的JSON数据不全

二、Hive处理JSON数据方式

(一)将Flume采集Kafka的JSON数据以字符串的方式整个写入Hive表中,然后再用get_json_object或json_tuple进行解析

1、ODS层建静态分区外部表,Flume直接写入ODS层表的HDFS路径下

create external table  if not exists  ods_evaluation(evaluation_json  string
)
comment '评价数据外部表——静态分区'
partitioned by (day string)
stored as SequenceFile
;

2、用get_json_object进行解析

selectget_json_object(evaluation_json,'$.deviceNo')        device_no,get_json_object(evaluation_json,'$.createTime')      create_time,get_json_object(evaluation_json,'$.cycle')           cycle,get_json_object(evaluation_json,'$.laneNum')         lane_num,get_json_object(evaluation_json,'$.evaluationList')   evaluation_list
from hurys_dc_ods.ods_evaluation
;

(二)在导入Hive表之前将JSON数据已拆分好,需要使用JsonSerDe

create  external  table  if not exists ods_track(device_no    string     comment '设备编号',create_time  timestamp  comment '创建时间',track_data   string     comment '轨迹数据集合(包含多个目标点)'
)
comment '轨迹数据表——静态分区'
partitioned by (day  date)
row format serde  'org.apache.hadoop.hive.serde2.OpenCSVSerde'
with serdeproperties (
"separatorChar" = ",",
"quoteChar" = "\"",
"escapeChar" = "\\"
)
tblproperties("skip.header.line.count"="1") ; 

注意:使用JsonSerDe时,每行必须是一个完整的JSON,一个JSON不能跨越多行,否则不能使用JsonSerDe

三、ODS层原有建表SQL

create external table  if not exists  ods_evaluation(evaluation_json  string
)
comment '评价数据外部表——静态分区'
partitioned by (day string)
row format delimited fields terminated by '\x001'
lines terminated by '\n'
stored as SequenceFile
;

四、HDFS文件中的数据

HDFS文件中JSON数据完整,数据没问题

五、报错详情

查看表数据时发现evaluation_json字段的数据不完整

六、解决方法

(一)重新建表,建表语句中删除其中两行

--row format delimited fields terminated by '\x001'
--lines terminated by '\n'

(二)新建表SQL

create external table  if not exists  ods_evaluation(evaluation_json  string
)
comment '评价数据外部表——静态分区'
partitioned by (day string)
stored as SequenceFile
;

七、查询新表中evaluation_json字段的数据

数据解析成功!

又解决了一个问题,宾果!

http://www.yayakq.cn/news/787809/

相关文章:

  • 河南网站建设公司排名网站的运作流程
  • 关于网站建设的介绍随州网站设计开发方案
  • 网站开发的学校博客园 wordpress
  • 江门网站瑞安网站建设公司
  • php网站上传教程推广论坛有哪些
  • 有什么网站是layui做的广告做图网站
  • 网站建设总体框架dnf免做卡怎么领取网站
  • 丽水城乡建设局网站望野博物馆观后感
  • 门户网站建设方杭州网站建设公司哪家好
  • 北京网站建设明细建设网站是什么关系
  • 高校门户网站源码.net建网站的优势
  • 网站服务器备案查询网站备案500万网官网
  • 苏州新区建网站在线网站制作模拟
  • 建设银行商城网站珠宝设计网站
  • 自己做网站送外卖wordpress主题 ux
  • 做结构图用什么网站do_action wordpress 模板
  • 做网站_没内容wordpress用户头像插件
  • 国内网站主机手机网站设计软件
  • 网站建设宣传广告wordpress导航怎么改
  • app下载官方网站wordpress 用户介绍
  • 天安云谷网站建设移动网站性能
  • 网站建设外包公司容易被客户投诉吗西安网站制作流程
  • 做响应式网站设计师如何布局呢中山做网站的
  • 西安微信网站单页面推广网站模版
  • 北京公司如何做网站河南省建筑工程信息网
  • wordpress 小视频模板下载百度seo引流怎么做
  • 湘西泸溪网站建设做soho外贸网站
  • scala网站开发长沙事业单位招聘信息网
  • 网站打开速度影响因素哪个公司做网站推广最好
  • 云南城市建设职业学院网站淮安 网站建设