当前位置: 首页 > news >正文

网站建设钟振森wordpress怎么画表格

网站建设钟振森,wordpress怎么画表格,京东页面网页设计与制作实训报告,百度惠生活推广怎么收费前言 随着大数据技术的普及,数据仓库的部署方式也在发生着改变,之前在部署数据仓库项目时,首先想到的是选择国外哪家公司的产品,比如:数据存储会从Oracle、SqlServer中或者Mysql中选择,ETL工具会从Informa…

前言

随着大数据技术的普及,数据仓库的部署方式也在发生着改变,之前在部署数据仓库项目时,首先想到的是选择国外哪家公司的产品,比如:数据存储会从Oracle、SqlServer中或者Mysql中选择,ETL工具会从Informatica、DataStage或者Kettle中选择,BI报表工具会从IBM cognos、Sap Bo或者帆软中选择,基本上使用的产品组合都类似,但随着数据量的激增,之前的部署方式已经越来越不能满足业务场景,例如:不同格式的数据存储,传出的数据库无法存储,而且随着数量的增多,数据库的响应速度就会下降,并且数据大都是T+1的,往往从业务需求的提交到BI报表开发都需要一段时间,等BI报表开发后,数据的时效性大大降低,无法为业务的决策及时性提供帮助,后来随着hadoop的流行,数据仓库慢慢的就演变为以hadoop为基础存储的大数据仓库,并解决了传统数仓无法承载激增数据量的问题,并且随着计算引擎的迭代更新,现在也能实现数据的实时性和事务性,本篇就以新起之秀的数据存储方式来展开介绍。


提示:以下案例仅供参考

一、paimon是什么?

paimon是一种基于LSM形式的数据湖存储格式,与hudi、iceberg定位相同,都是一种基于对hdfs文件存储管理的技术,flink与hudi和iceberg都有做过集成,但hudi和iceberg相当于spark的功能更为完善,这些数据湖格式也都更偏向于批处理,而相对于flink来说,提供的功能相较于spark来说,没有那么完善,虽然flink针对这些方面有做过努力尝试,但结果都不太理想,于是,flink基于前者的有点,自己创造一种数据湖存储格式,其基于flink table store的基础,在结合其他开源数据湖格式的特点加以改进,于是一种新的数据湖格式paimon就诞生了,本人也是最近才开始尝试这种新的数据湖格式的一些功能,下面是基于sql api编写的一个简单的例子。

二、Fink SQL API方式编程

1.创建kafka流标

我这边是以yarn-session的方式执行的,所以首先启动的session,cd $FLINK_HOME,执行bin/yarn-session -d -nm test创建一个名称为test的session会话,随后执行bin/sql-client -s yarn-session进入sql客户端,直接使用默认的catalog和database,执行下面的DDL语句,就会在default_catalog.default_database下创建一个kafka_table表

create temporary table `kafka_table`(
`distinct_id` string,
`login_id` string,
`anonymous_id` string,
`type` string,
`event` string,
`_track_id` string,
`time` string,
`_flush_time` string,
`device_id` string,
`project_id` string,
`map_id` string,
`user_id` string,
`recv_time` string) with('connector'='kafka','topic'='event_topic','properties.group.id'='testgroup','properties.bootstrap.servers'='cdp1:9092','scan.startup.mode'='latest-offset','format'='json');

2.创建paimon append表

接着执行如下DDL语句

CREATE TABLE paimon_append (
`distinct_id` string,
`login_id` string,
`anonymous_id` string,
`type` string,
`event` string,
`_track_id` string,
`time` string,
`_flush_time` string,
`device_id` string,
`project_id` string,
`map_id` string,
`user_id` string,
`recv_time` string
) PARTITIONED BY (`distinct_id`)
WITH (
'bucket' = '-1'
);

3.数据导入

SET ‘execution.checkpointing.interval’ = ‘1 min’;
INSERT INTO paimon_append SELECT * FROM kafka_table;


总结

以上就是一个消费kafka主题数据,并每隔一定的间接直接,写入到paimon表中,paimon会对小文件数据量达到一定程度后,对文件进行压缩合并,并且paimon也支持merge into、update、以及schema evolution等功能,由于时间有限,这里就不仔细展开了,有兴趣的朋友,可以亲自尝试下,版本目标已经更新到0.7,为flink的生态状态又增加了一环,目前flink cdc 、paimon的加持、能很好的解决lamda架构数据不一致,以及kappa架构数据追溯的问题,相信随着后续版本的迭代更多强大的功能也会推出。

http://www.yayakq.cn/news/60030/

相关文章:

  • 房地产行业网站模版网站是什么意思
  • 深圳鸿运通网站建设齐鲁建设网站
  • ppt模板免费下载素材医学类南通网站建设优化公司
  • 无锡自适应网站开发网站建设 做一个网站需要多少钱
  • 在上面网站上可以做统计图WordPress中文版如何下载
  • 响应式公司网站李沧做网站公司
  • 江苏金地建设工程有限公司网站快手小程序入口
  • 吴江城乡建设局网站wordpress文章id排序
  • 做一套公司网站费用用于网站建设的费用怎么备注
  • 网页设计作品到哪个网站德州哪里有做网站推广的
  • 响应式网站好处网站建设招标方案
  • 义乌建网站苏州知名网站制作
  • 电商公司网站建设流程导视设计图片
  • 上海昆山网站公司手机手机端网站建设
  • 百度新闻源网站有哪些北京广告设计公司排行
  • 做养生网站需要证件吗购物网站建设合同
  • 个人做网站需要资质吗温州网站制作费用
  • 网站建设 李奥贝纳焊枪公司网站怎么做
  • 做生蚝的网站中国城乡建设厅网站首页
  • 框架网站怎么做公司网站后台如何上传视频
  • 在线捏脸网站需要多少钱盐城网站开发代理
  • 河源正规网站建设价格专业做物业网站的公司
  • 如何禁止通过ip访问网站沈阳最新公告
  • 网站内外链接怎么做wordpress能放几个域名
  • 漂亮企业网站湖南门户网站建设
  • 企业网站建设与推广四川建设网有限责任公司招聘
  • 网站建设的讲话稿哪个网站专做二手相机
  • 广州商城型网站建设wordpress主题模板修改教程
  • 西安建站价格高站网站建设
  • 受欢迎的网站建设平台镇江网站建设