当前位置: 首页 > news >正文

无锡市住房和城乡建设部网站国内企业邮箱哪家好

无锡市住房和城乡建设部网站,国内企业邮箱哪家好,自动发货 wordpress,服装品牌策划公司前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的 于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每…

前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的

于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每日分区的筛选条件

在反反复复测试调整以后, 我发现问题出在这里:

隐式join的时候顺序问题会导致错误的笛卡尔积(不确定什么版本hive)
假如t1和t2关联,t2和t3关联, 但是如果写成了from t1,t3,t2比如下面这样, 就会造成t1和t3直接笛卡尔积, 再和t2笛卡尔积, 再where筛选

-- 
select x
from t1,t3,t2
where t1.id = t2.t1_id 
and t2.id = t3.t2_id

比如t1,t2,t3表都是1000, 彼此关联的是10条, 则按常理应该是t1和t2筛选和关联后得到临时表10条, 然后这10条再和t3进行10*1000筛选和关联.

但是根据explain解释执行, 貌似hive会将上面的直接1000* 1000*1000 可想而知这个效率会是怎么样
在这里插入图片描述

最后改为正确的顺序, 从1天多变成了二几分钟.搞定
在这里插入图片描述

结论

  1. hive这个不知道是不是bug, 也可能后续会修复, 但是保险起见最好按表的关联顺序来写
  2. 建议用显式join查询
  3. 写完hive脚本测试跑一次看看效率,不确定就explain
http://www.yayakq.cn/news/161926/

相关文章:

  • 眉山市住房城乡建设局 网站营销网站开发系统
  • 北京火车站建站时间大学生网站建设策划书
  • 米拓企业网站管理系统网站建设前的需求分析
  • 药检局信息化网站系统建设方案个人博客网页完整代码
  • 网站开发有哪些风险wordpress 页面设置不了标签页
  • 网站引导页怎么做的江苏建设一体化平台网站
  • 公司做环评的网站专业网页制作哪家好
  • 郑州做网站熊掌号南阳东莞网站建设公司
  • 做网站设计要适配到手机端么摄影网站公司
  • 建设好的网站怎么发布精品网站建设多少钱
  • 网站建设一般多少钱app网站开发笔记本
  • 网站免费建设价格学校网站建设发展历程
  • 查询建设规范的网站国内室内设计网站大全
  • 电台网站建设要求购物网站起名
  • 做网站前端视频大连建设工程信息网登陆
  • 怎么接网站建设的单子中文在线っと好きだっ最新版
  • 专门做考研的网站海外营销网站
  • 自己可以用百度云做网站吗wordpress文章添加忽略
  • asp网站开发上传组建企业网站开发制作合同
  • 彩票游戏网站开发胶州网站制作
  • app下载安装安卓版seo工程师是做什么的
  • 东莞网站建设公司怎么做众筹网站开发需求
  • 防水补漏东莞网站建设钉钉小程序开发
  • 自建门户网站网易搜索引擎入口
  • 免费软件下载大全攀枝花网站怎么做seo
  • 长沙企业网站建设收费推广普通话的标语
  • iis默认网站删除来安县城乡规划建设局网站
  • 动效做的好的网站网站开发协议书由谁来写
  • 青岛做网络直播的网站网络安全管理平台
  • 中关村在线官方网站电脑seo成都培训