Java技术债务Java技术债务

  •  首页
  •  分类
  •  归档
  •  标签
  • 博客日志
  • 资源分享
  •  友链
  •  关于本站
注册
登录

简单介绍ClickHouse(一)

ClickHouse,数据库

文章目录


1、什么是ClickHouse

ClickHouse是列式存储数据库(DBMS)——擅长分析数据,主要用于在线分析处理查询OLAP。20.6版本后新增工具:explain

新版本优化

  • 建表、基于RBO的优化规则
  • 单表查询,关联查询等的优化

特性

  • 物化视图(20.8版本之后,eg:物化MySQL)

2、ClickHouse的特点

2.1 列式存储

简单介绍ClickHouse(一) - Java技术债务 采用行式存储时,数据在磁盘上的数据结构是: 简单介绍ClickHouse(一) - Java技术债务 采用列式存储时,数据在磁盘上的数据结构时: 简单介绍ClickHouse(一) - Java技术债务

好处: - 查询某个人的所有属性时,一次磁盘查询按照顺序查询就可以

缺点:

  • 查询所有人的年龄时,遍历很多不需要的数据,需要全表扫描
**列式存储的好处**

列的聚合、计数、求和等统计操作优于行式存储 由于列的数据类型都是相同的,针对数据存储更容易进行数据压缩 对cache更有利

2.2 DBMS 的功能

>几乎覆盖了标准 SQL 的大部分语法,包括 DDL 和 DML,以及配套的各种函数,用户管理及权限管理,数据的备份与恢复。

2.3 多样化引擎

>ClickHouse 和 MySQL 类似,把表级的存储引擎插件化,根据表的不同需求可以设定不同
的存储引擎。目前包括合并树、日志、接口和其他四大类 20 多种引擎。

2.4 高吞吐写入能力

> ClickHouse 采用类 LSM Tree 的结构,数据写入后定期在后台 Compaction。通过类 LSM tree 的结构,ClickHouse 在数据导入时全部是顺序 append 写,写入后数据段不可更改,在后台 compaction 时也是多个段 merge sort 后顺序写回磁盘。顺序写的特性,充分利用了磁盘的吞 吐能力,即便在 HDD 上也有着优异的写入性能。

>官方公开 benchmark 测试显示能够达到 50MB-200MB/s 的写入吞吐能力,按照每行 100Byte 估算,大约相当于 50W-200W 条/s 的写入速度。
> 

2.5 数据分区与线程级并行

> ClickHouse 将数据划分为多个 partition,每个 partition 再进一步划分为多个 index granularity(索引粒度),然后通过多个 CPU 核心分别处理其中的一部分来实现并行数据处理。 在这种设计下,单条 Query 就能利用整机所有 CPU。极致的并行处理能力,极大的降低了查 询延时。

>所以,ClickHouse 即使对于大量数据的查询也能够化整为零平行处理。但是有一个弊端 就是对于单条查询使用多 cpu,就不利于同时并发多条查询。所以对于高 qps 的查询业务, ClickHouse 并不是强项。

3、性能对比

简单介绍ClickHouse(一) - Java技术债务 简单介绍ClickHouse(一) - Java技术债务

1、什么是ClickHouse

ClickHouse是列式存储数据库(DBMS)——擅长分析数据,主要用于在线分析处理查询OLAP。20.6版本后新增工具:explain

新版本优化

  • 建表、基于RBO的优化规则
  • 单表查询,关联查询等的优化

特性

  • 物化视图(20.8版本之后,eg:物化MySQL)

2、ClickHouse的特点

2.1 列式存储

简单介绍ClickHouse(一) - Java技术债务 采用行式存储时,数据在磁盘上的数据结构是: 简单介绍ClickHouse(一) - Java技术债务 采用列式存储时,数据在磁盘上的数据结构时: 简单介绍ClickHouse(一) - Java技术债务

好处: - 查询某个人的所有属性时,一次磁盘查询按照顺序查询就可以

缺点:

  • 查询所有人的年龄时,遍历很多不需要的数据,需要全表扫描
**列式存储的好处**

列的聚合、计数、求和等统计操作优于行式存储 由于列的数据类型都是相同的,针对数据存储更容易进行数据压缩 对cache更有利

2.2 DBMS 的功能

>几乎覆盖了标准 SQL 的大部分语法,包括 DDL 和 DML,以及配套的各种函数,用户管理及权限管理,数据的备份与恢复。

2.3 多样化引擎

>ClickHouse 和 MySQL 类似,把表级的存储引擎插件化,根据表的不同需求可以设定不同
的存储引擎。目前包括合并树、日志、接口和其他四大类 20 多种引擎。

2.4 高吞吐写入能力

> ClickHouse 采用类 LSM Tree 的结构,数据写入后定期在后台 Compaction。通过类 LSM tree 的结构,ClickHouse 在数据导入时全部是顺序 append 写,写入后数据段不可更改,在后台 compaction 时也是多个段 merge sort 后顺序写回磁盘。顺序写的特性,充分利用了磁盘的吞 吐能力,即便在 HDD 上也有着优异的写入性能。

>官方公开 benchmark 测试显示能够达到 50MB-200MB/s 的写入吞吐能力,按照每行 100Byte 估算,大约相当于 50W-200W 条/s 的写入速度。
> 

2.5 数据分区与线程级并行

> ClickHouse 将数据划分为多个 partition,每个 partition 再进一步划分为多个 index granularity(索引粒度),然后通过多个 CPU 核心分别处理其中的一部分来实现并行数据处理。 在这种设计下,单条 Query 就能利用整机所有 CPU。极致的并行处理能力,极大的降低了查 询延时。

>所以,ClickHouse 即使对于大量数据的查询也能够化整为零平行处理。但是有一个弊端 就是对于单条查询使用多 cpu,就不利于同时并发多条查询。所以对于高 qps 的查询业务, ClickHouse 并不是强项。

3、性能对比

简单介绍ClickHouse(一) - Java技术债务 简单介绍ClickHouse(一) - Java技术债务

完
  • 本文作者:Java技术债务
  • 原文链接: https://cuizb.top/myblog/article/1638953470
  • 版权声明: 本博客所有文章除特别声明外,均采用 CC BY 3.0 CN协议进行许可。转载请署名作者且注明文章出处。
阅读全文
Java技术债务

Java技术债务

Java技术债务
Java技术债务
热门文章
  1. ClickHouse使用过程中的一些查询优化(六)2003
  2. MySQL数据库被攻击,被删库勒索,逼迫我使出洪荒之力进行恢复数据764
  3. MySQL主从同步原理458
  4. 线程池的理解以及使用414
  5. Spring Cloud Gateway整合nacos实战(三)409
分类
  • Java
    30篇
  • 设计模式
    27篇
  • 数据库
    20篇
  • Spring
    18篇
  • MySQL
    13篇
  • ClickHouse
    11篇
  • Kubernetes
    10篇
  • Redis
    9篇
  • Docker
    8篇
  • SpringBoot
    7篇
  • JVM
    6篇
  • Linux
    5篇
  • Spring Cloud
    5篇
  • 多线程
    5篇
  • Netty
    4篇
  • Kafka
    4篇
  • 面经
    4篇
  • Nginx
    3篇
  • JUC
    3篇
  • 随笔
    2篇
  • 分布式
    1篇
  • MyBatis
    1篇
  • 报错合集
    1篇
  • 生活记录
    1篇
  • 源码
    1篇
  • 性能优化
    1篇

最新评论

  • MySQL数据库被攻击,被删库勒索,逼迫我使出洪荒之力进行恢复数据2022-05-06
    Java技术债务:@capture 一起探讨学习,服务器被黑很正常,及时做好备份以及做好防护
  • MySQL数据库被攻击,被删库勒索,逼迫我使出洪荒之力进行恢复数据2022-04-13
    capture:我的刚上线两天,网站里就两篇文章也被攻击了,纳闷
  • Java常用集合List、Map、Set介绍以及一些面试问题2022-01-18
    Java技术债务:HashSet和TreeSet 相同点:数据不能重复 不同点: 1、底层存储结构不同; HashSet底层使用HashMap哈希表存储 TreeSet底层使用TreeMap树结构存储 2、唯一性方式不同 HashSet底层使用hashcode()和equal()方法判断 TreeSet底层使用Comparable接口的compareTo判断的 3、HashSet无序,TreeSet有序
  • undefined2021-12-14
    Java技术债务:如果不指定线程池,CompletableFuture会默认使用ForkJoin线程池,如果同一时间出现大量请求的话,会出现线程等待问题,建议使用自定义线程池。。。
  • undefined2021-12-02
    you:很好,对于小白相当不错了,谢谢
  • CSDN
  • 博客园
  • 程序猿DD
  • 纯洁的微笑
  • spring4all
  • 廖雪峰的官方网站
  • 猿天地
  • 泥瓦匠BYSocket
  • crossoverJie
  • 张先森个人博客
  • 越加网

© 2021-2022 Java技术债务 - Java技术债务 版权所有
总访问量 0 次 您是本文第 0 位童鞋
豫ICP备2021034516号
Java技术债务 豫公网安备 51011402000164号

微信公众号

Java技术债务
Java技术债务

专注于Spring,SpringBoot等后端技术探索

以及MySql数据库开发和Netty等后端流行框架学习

日志
分类
标签
RSS

有不足之处也希望各位前辈指出