当前位置: 首页 > news >正文

重视网站阵地建设建网站怎么样才能流畅

重视网站阵地建设,建网站怎么样才能流畅,百度关键词排名qq,非小号是根据国外哪个网站做的场景: 今天接了一个需求,将测试环境的hive数据导入到正式环境中。但是不需要整个流程的迁移,只需要迁移ads表 解决方案: 拿到这个需求首先想到两个方案: 1、将数据通过insert into语句导出,然后运行脚本 …

场景:

今天接了一个需求,将测试环境的hive数据导入到正式环境中。但是不需要整个流程的迁移,只需要迁移ads表


解决方案:

拿到这个需求首先想到两个方案:

1、将数据通过insert into语句导出,然后运行脚本
2、数据导出成csv格式的数据,然后Load进hive

方案一的实践过程中,发现几个问题,然后果断进行了方案二。就讲讲方案一存在的问题

  1. ads数据量较大。存在18W的数据量,对于大集群而言不值一提,但是公司的堡垒机资源较小,且用DBServer不支持18WSQL执行
  2. DBServer hive不支持SQL脚本运行,只能粘贴复制,还是问题一一样资源太小
    最终采用方案二

实践过程:

这里就说说方案二遇到的问题以及解决方案

  1. hive查询结果导出CSV时间格式问题。下图就我设置了CSV导出格式,但是还是存在问题,且时间格式还存在引号的情况,所以将数据导出来之后,用WPS进行打开,对时间格式进行一个调整,然后在保存为CSV结构的数据,用nodepad++打开即可
    在这里插入图片描述

  2. hive导入成功但数据不存在。下面截图就展示了存在的问题。这个问题就是因为hive建表的问题,hive建表的格式不是文本格式导致的。我开始用的org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat,后续如果不指定格式,默认格式就是org.apache.hadoop.mapred.TextInputFormat即可导入进去
    在这里插入图片描述在这里插入图片描述

  3. hive数据导入之后一行的数据都存在某一个字段中。这个问题是因为hive没有指定数据导入后按照什么方式进行分割。SET SERDEPROPERTIES ('field.delim'=',', 'serialization.format'=' ')指定这个参数后,hive会将csv导入的数据按照逗号分隔。但是请注意,你的数据存在json数据或者别的逗号数据,导入后可能会产生数据错位的情况。在条件允许的情况下,将json和数据中的逗号,在WPS中用中文逗号替换即可。

  4. 其他的解决方案:其实这种类型的问题解决方案应该很多。例如:shell脚本执行hive insert语句、将数据插入到mysql用ETL的方式抽取到hive目标表。

总结:

导入数据考验一个细心的程度其实问题也不难,就是麻烦。如果其他网友有更好的解决办法,欢迎留言

http://www.yayakq.cn/news/124601/

相关文章:

  • 如何登录网站服务器网络营销推广流程
  • 昆山装饰公司网站建设全球访问量最大的网站排名
  • 网站首页是什么意思html5开发环境
  • 科技网站设计资讯平面设计能干一辈子吗
  • jquery 素材的网站浪漫免费表白网站
  • 做自媒体在哪个网站好个人网站怎么做打赏
  • 云邦北京网站建设dede静态网站
  • 建站套餐推荐如何注册域名免费
  • 东乌珠穆沁旗网站建设沈阳百度seo排名优化软件
  • 制作网站教程视频wordpress 当前列表数
  • 简历网站免费搜狗seo软件
  • 有没有装修做团购的网站欢迎访问中国建设银行网站
  • 找南阳建立网站的公司wordpress淘宝客源码
  • 礼盒包装设计网站net手机网站开发
  • 聊城网站推广软件苏州网页设计培训班
  • 成品网站源码1688自动跳转永州网站建设效果
  • 网站建设主要问题及建议淄博教育学校网站建设
  • 免费的域名网站网站照片上传不了怎么办
  • 深圳龙华网站公司网站开发背景介绍
  • 电子商务网站建设与综合实践建设总承包网站
  • 制定一个网站建设方案什么网站做唱歌主播
  • 微信网站二次开发wordpress页面归档
  • 简易的网站数码网站名
  • 主机屋网站河北网站优化建设
  • 傻瓜使用模板建网站上海注册公司代理记账
  • 网站建设标书模板创意网站展示
  • 制作网站费用怎么做分录专业深圳网站建设公司
  • 有哪些网站用vue做的人人建站
  • 温州企业建站系统南京好的网站制作公司
  • 自己做网站可以赚钱么jsp网站开发分享网站