当前位置: 首页 > news >正文

外贸建站推广企业网站导航一般做多高

外贸建站推广,企业网站导航一般做多高,书吧网站设计论文,网页设计师是什么意思前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的 于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每…

前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的

于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每日分区的筛选条件

在反反复复测试调整以后, 我发现问题出在这里:

隐式join的时候顺序问题会导致错误的笛卡尔积(不确定什么版本hive)
假如t1和t2关联,t2和t3关联, 但是如果写成了from t1,t3,t2比如下面这样, 就会造成t1和t3直接笛卡尔积, 再和t2笛卡尔积, 再where筛选

-- 
select x
from t1,t3,t2
where t1.id = t2.t1_id 
and t2.id = t3.t2_id

比如t1,t2,t3表都是1000, 彼此关联的是10条, 则按常理应该是t1和t2筛选和关联后得到临时表10条, 然后这10条再和t3进行10*1000筛选和关联.

但是根据explain解释执行, 貌似hive会将上面的直接1000* 1000*1000 可想而知这个效率会是怎么样
在这里插入图片描述

最后改为正确的顺序, 从1天多变成了二几分钟.搞定
在这里插入图片描述

结论

  1. hive这个不知道是不是bug, 也可能后续会修复, 但是保险起见最好按表的关联顺序来写
  2. 建议用显式join查询
  3. 写完hive脚本测试跑一次看看效率,不确定就explain
http://www.yayakq.cn/news/116934/

相关文章:

  • APP客户端网站建设福田公司怎么样
  • php网站开发报价网站建设十年经验
  • 大型服装商城网站建设设计企业
  • 网站开发感想移动商城搭建
  • 郑州做网站的外包公司有哪些梦幻西游网页微信版
  • 自己创免费网站外贸cms 网站
  • 北京网站设计网站设计公司企业年金有什么好处
  • asp网站 换模板所有关键词
  • 为什么要进行网站备案广告投放价目表
  • 老薛主机wordpress慢seo顾问招聘
  • 合肥网站优化排名推广关键词排名优化易下拉教程
  • 怎么用ftp备份网站哈默wordpress上传
  • 小程序注册教程临沂seo公司稳健火星
  • 云虚拟主机怎么建网站wordpress是框架么
  • net网站开发学习衡水网站制作公司
  • 上海景泰建设有限公司网站搭建公司介绍网站
  • 兰州电商网站建设网站上社保做增员怎么做
  • 保定网站维护公司xly000.wordpress 伪装
  • 网站建设需要提供哪些材料个人用wordpress做网页
  • 信阳做房产哪个网站好用广西壮族自治区行政执法人员培训
  • 网站的备案号查询嘉定网站设计公司
  • 有pc网站 移动网站怎么做建站源码
  • 韩国优秀网站欣赏网站 方案
  • 深圳网站建设哪家公司好温州设计网站建设
  • seo自动刷外链工具郑州官网seo技术
  • 网站推广广告申请微信服务平台开发
  • 宁德古田建设局网站网络营销计划书怎么写
  • 网站设计和营销福建省建设厅网站林瑞良
  • 服务器上怎做网站做的很漂亮的网站
  • 主流的网站开发框架如何做网站短链接