当前位置: 首页 > news >正文

珠海建设网站的公司简介扁平化企业网站模板

珠海建设网站的公司简介,扁平化企业网站模板,wordpress自定义模块,代码家的干货网站文章目录 背景配置单机配置HA高可用Hdfs集群性能测试统计trait最多的10个trait term统计性状xxx minValue > 500 0000的数量结论 参考文档 背景 由于公司初始使用Hadoop这一套,所以希望ClickHouse也能使用Hdfs作为存储 看了下ClickHouse的文档,拿Hdf…

文章目录

      • 背景
      • 配置单机
      • 配置HA高可用Hdfs集群
      • 性能测试
        • 统计trait最多的10个trait term
        • 统计性状xxx minValue > 500 0000的数量
        • 结论
      • 参考文档

背景

由于公司初始使用Hadoop这一套,所以希望ClickHouse也能使用Hdfs作为存储
看了下ClickHouse的文档,拿Hdfs举例来说,有两种方式来完成,一种是直接关联Hdfs上的数据文件,比如说TSV格式的文件,这种模式不支持插入数据。第二种是将Hdfs作为存储,可以理解为云存储方式,这篇文章讲解第二种方式的配置

官方文档:External Disks for Storing Data

配置单机

修改config.xml文件,一般路径在/etc/clickhouse-server/config.xml

 	<storage_configuration><disks><hdfs><type>hdfs</type><endpoint>hdfs://hdfs1:9000/clickhouse/</endpoint></hdfs></disks><policies><hdfs><volumes><main><disk>hdfs</disk></main></volumes></hdfs></policies></storage_configuration><merge_tree><min_bytes_for_wide_part>0</min_bytes_for_wide_part></merge_tree>

配置后重启

配置HA高可用Hdfs集群

  1. 复制hadoop下的配置文件hdfs-site.xml/etc/clickhouse-server/
  2. 修改config.xml配置文件,将endpoint中的标签内容,替换为cluster
        <disks><hdfs><type>hdfs</type><endpoint>hdfs://cluster1/clickhouse/</endpoint></hdfs></disks>

这种方式的配置是没有端口的

  1. 拷贝了hdfs-site.xml文件,但是ClickHouse还不能识别到该文件,所以需要配置在config.xml的配置文件下
    <hdfs><libhdfs3_conf>/etc/clickhouse-server/hdfs-site.xml</libhdfs3_conf></hdfs>

这里在官方文档的另外一处有提到
地址:HDFS
在这里插入图片描述
配置完成,重启

这里配置集群模式有些折腾,看到之前有讲如果是hdfs-client.xml这种的,可以参考下。中间还设置过环境变量:
How do I use an HDFS engine in HA mode

性能测试

使用hdfs作为外部存储的时候,需要在建表时,设置存储策略,举例如下:

CREATE TABLE trait_term
(id UUID,termName String
)
ENGINE = MergeTree
PRIMARY KEY (id)
ORDER BY id
SETTINGS index_granularity = 1024, storage_policy='hdfs', index_granularity_bytes = 0;

需要添加storage_policy='hdfs', 这样数据就会存储到hdfs中,在hdfs文件系统中查看
在这里插入图片描述

查询性能对比:
在这里插入图片描述
在这里插入图片描述
trait表大概有1700w条数据,这里主要和之前不使用外部存储,使用clickhouse当前机器的存储做对比

统计trait最多的10个trait term

场景内部存储hdfs存储
直接查询0.767s0.723s
创建视图查询0.495s0.471s
子查询优化0.157s0.172s

统计性状xxx minValue > 500 0000的数量

场景内部存储hdfs存储
直接查询0.263s0.353s
子查询优化0.131s0.207s
创建视图走索引0.01s0.023s
降低稀疏索引粒度0.007s0.015s

结论

根据测试结果,hdfs外部存储会比直接内部存储性能差一点点,但是也差不了多少,使用hdfs可以避免单机存储不够的问题,与公司的技术栈也会保持一致

参考文档

clickhouse之HDFS云存储
clickhouse hive/hdfs引擎由于HDFS-HA报错问题解决
How do I use an HDFS engine in HA mode

http://www.yayakq.cn/news/33989/

相关文章:

  • 怎么做网络销售的网站官方网站 建设情况汇报
  • 重庆 网站开发建设银行杭州招聘网站
  • wordpress 整站源码网站建设要学
  • 河北城乡建设网站企业建立网站需要
  • 嘉盛建设集团官方网站一个网站要注意哪些问题
  • 婚庆公司网站模板下载零代码建站
  • 上海 科技网站建设怎么在公众号做影视网站
  • 在线观看免费网站网址南京高端网站设计
  • 上海网站优化推广公司注册会计师报名条件
  • 深圳有做网站最近价格?wordpress企业免费主题下载
  • 中英文网站英文无锡专业制作外贸网站的公司
  • 网站建设技术支持祥云平台那个网站可以做域名跳转的
  • 表白网页制作免费网站制作推荐网站建设服务商
  • 宝坻手机网站建设wordpress博客打开慢
  • 网站改版被降权江阴哪里有做网站的
  • 嘉兴南湖区优秀营销型网站建设网站备案主体修改
  • 上海网站建设公司指南大连公司名称大全
  • 注册网站做推广网站导航cms
  • 响应式网站 翻译代码网站域名的根目录在哪里
  • 韶关网站建设科技有限公司做网站收费多少
  • 网站建设一般需要多少费用电子商务网站建设与管理英文
  • 免费查企业电话网站怎样建网站得花多少钱
  • 网站公司logo设计如何创建网址快捷方式
  • 阿里巴巴做网站装饰工程投标书
  • 网站建设推广扬州南昌做购物网站的公司
  • 京东联盟怎么做网站建设银行网网站打不开
  • 免费传奇网站免费传奇云空间的网站
  • 衡水网站推广抖音小程序源码
  • 石家庄网站建设 河北供求网网站利用百度离线地图
  • 乐山 网站建设电脑软件制作入门教程