当前位置: 首页 > news >正文

全国最大型网站建设网站运营与建设作业

全国最大型网站建设,网站运营与建设作业,帮网贷做网站会判刑吗,wordpress设置阅读全文背景: 数据中台项目使用Spark+Hive+Paimon做湖仓底层,调度任务使用的是基于Dolphinscheduler进行二开。在做离线脚本任务开发时,在Paimon库下执行非查询类SQL报错。 INSERT报错 DELETE报错 现状: 原始逻辑为数据中台中选择的Paimon数据源,实际上在Dolphinscheduler中是…

背景:

数据中台项目使用Spark+Hive+Paimon做湖仓底层,调度任务使用的是基于Dolphinscheduler进行二开。在做离线脚本任务开发时,在Paimon库下执行非查询类SQL报错。

INSERT报错

DELETE报错

 现状:

原始逻辑为数据中台中选择的Paimon数据源,实际上在Dolphinscheduler中是选择的Hive数据源。所以在Dolphinscheduler中,实际上是选择了一个SQL类型的任务节点,数据原类型选择Hive。执行后就会报以上两个错误。

排查思路以及解决方案:

在这种多组件复杂环境的情况下去排查问题,需要分段排查。首先确认是否是数据中台代码的问题。

1. 脱离数据中台直接在Dolphinscheduler创建一个工作流,任务节点选择SQL,选择Hive数据源执行insert代码。发现是同样的报错。

所以可以先排除是数据中台在创建Dolphinscheduler工作流的问题,但这不代表原逻辑正确。

2. Dolphinscheduler只是一个调度,除非是他无法实现这个功能,基本上不会出现问题,所以继续向下排查。

3. 排查Spark+Hive+Paimon

分别来看一下这三个组件在数据中台中的作用

Spark+Hive

在我们的中台中,是Spark on Hive 是Hive只作为存储角色,Spark负责sql解析优化,执行。也就是Spark 通过Spark SQL 使用Hive 语句操作Hive表 ,底层运行的还是 Spark RDD。

具体步骤如下:

  • 通过SparkSQL,加载Hive的配置文件,获取到

http://www.yayakq.cn/news/25057/

相关文章:

  • 电商行业网站建设及维护网页制作的开发平台
  • 卦神岭做网站willfast优化工具下载
  • 个人响应式网站重庆企业年报网上申报入口
  • 如何快速提高网站关键词排名世界500强企业关于优秀员工的12条核心标准
  • 很有设计感的企业网站中国纪检监察报简介
  • 备份整个网站做一个新公司网站要多少钱
  • 无锡网站建设哪家公司好宣传册设计公司
  • 免费网站建设步骤淄博网站
  • 怎么做自己的网站主页劳务派遣做网站有必要吗
  • 做网站毕业答辩会问什么反邪手机网站建设方案
  • 做网店有哪些拿货网站优秀交互设计网站
  • 个人做网站用哪个主机好建设银行手机银行网站用户名
  • com网站域名可以是汉字吗足球比赛直播2021欧冠决赛
  • 免费自己制作网站方法游戏怎么开科技
  • 建设网站怎么收费wordpress 无法在线升级
  • 有关做有机肥的企业网站做数码后期上数码网站
  • 网站素材大全北京装修公司口碑最好的是哪家
  • 网站模板 黑白小程序制作实惠首选华网天下
  • 城阳做网站找哪家好网站的风格设计
  • 平台网站开发是什么意思wordpress前台加速
  • 网页图片批量下载seo网站推广的主要目的是什么
  • 怎样建设VR网站济宁推广
  • 网站建设开发软件哪些是+joomla做的网站
  • 免费网站搭建系统自己怎样做海外网站
  • 沈阳网站优化建设昵图网素材图库免费下载
  • 南坪做网站跨境电商需要投资多少
  • 西安做网站科技有限公司wordpress主题添加
  • 商业门户网站制作辽宁省网站制作
  • 东莞网站建设提供商自己做的网站图片打开慢
  • 会网站建设怎样赚钱西安百度公司电话