2.6 ClickHouse
clickhouse 官网中文文档 https://clickhouse.com/docs/zh/
2016 年 6 月 15 日,Yandex 开源了一个数据分析的数据库,名字叫做 ClickHouse。
2021 年 9 月,ClickHouse 的创建者 Alexey 在 GitHub 宣布他们决定正式从 Yandex 独立,成立一个公司:ClickHouse, Inc。
ClickHouse 是一个开源的面向列式数据的数据库管理系统,能够使用 SQL 查询并且生成实时数据报告。
应用场景
- 绝大多数请求都是用于读访问的
- 数据需要以大批次(大于 1000 行)进行更新,而不是单行更新;或者根本没有更新操作
- 数据只是添加到数据库,没有必要修改
- 读取数据时,会从数据库中提取出大量的行,但只用到一小部分列
- 表很
宽
,即表中包含大量的列 - 询频率相对较低(通常每台服务器每秒查询数百次或更少)
- 对于简单查询,允许大约 50 毫秒的延迟
- 列的值是比较小的数值和短字符串(例如,每个 URL 只有 60 个字节)
- 在处理单个查询时需要高吞吐量(每台服务器每秒高达数十亿行)
- 不需要事务
- 数据一致性要求较低
- 每次查询中只会查询一个大表。除了一个大表,其余都是小表
- 查询结果显著小于数据源。即数据有过滤或聚合。返回结果不超过单个服务器内存大小
不适用场景(使用限制)
- 不支持真正的删除/更新支持,不支持事务(事务性工作 OLTP)
- 不支持二级索引
- 有限的 SQL 支持,join 实现与众不同
- 不支持窗口功能
- 元数据管理需要人工干预维护
- 高并发的键值访问
- Blob 或者文档存储
本章参考
[1]. Greenplum 数据库架构分析及 5.x 新功能分享 http://blog.sina.com.cn/s/blog_12c856e4c0102yhek.html
[2]. Superset:Airbnb’s data exploration platform
[3]. Pinot 架构介绍 https://www.jianshu.com/p/67a9156f041a
[4]. impala 的原理架构介绍及应用场景 https://blog.csdn.net/javajxz008/article/details/50523332
[5]. Presto 架构及原理 https://www.cnblogs.com/tgzhu/p/6033373.html
[6]. LinkedIn Pinot 初探 https://blog.talkingdata.net/?p=3169
clickhouse 基础知识 https://www.jianshu.com/p/a5bf490247ea
解密 Apache HAWQ ——功能强大的 SQL-on-Hadoop 引擎 http://www.360doc.com/content/16/0524/14/23016082_561892469.shtml
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论