返回介绍

2.6 ClickHouse

发布于 2024-10-03 00:48:44 字数 2251 浏览 0 评论 0 收藏 0

clickhouse 官网中文文档 https://clickhouse.com/docs/zh/

2016 年 6 月 15 日,Yandex 开源了一个数据分析的数据库,名字叫做 ClickHouse。

2021 年 9 月,ClickHouse 的创建者 Alexey 在 GitHub 宣布他们决定正式从 Yandex 独立,成立一个公司:ClickHouse, Inc。

ClickHouse 是一个开源的面向列式数据的数据库管理系统,能够使用 SQL 查询并且生成实时数据报告。

应用场景

  1. 绝大多数请求都是用于读访问的
  2. 数据需要以大批次(大于 1000 行)进行更新,而不是单行更新;或者根本没有更新操作
  3. 数据只是添加到数据库,没有必要修改
  4. 读取数据时,会从数据库中提取出大量的行,但只用到一小部分列
  5. 表很 ,即表中包含大量的列
  6. 询频率相对较低(通常每台服务器每秒查询数百次或更少)
  7. 对于简单查询,允许大约 50 毫秒的延迟
  8. 列的值是比较小的数值和短字符串(例如,每个 URL 只有 60 个字节)
  9. 在处理单个查询时需要高吞吐量(每台服务器每秒高达数十亿行)
  10. 不需要事务
  11. 数据一致性要求较低
  12. 每次查询中只会查询一个大表。除了一个大表,其余都是小表
  13. 查询结果显著小于数据源。即数据有过滤或聚合。返回结果不超过单个服务器内存大小

不适用场景(使用限制)

  1. 不支持真正的删除/更新支持,不支持事务(事务性工作 OLTP)
  2. 不支持二级索引
  3. 有限的 SQL 支持,join 实现与众不同
  4. 不支持窗口功能
  5. 元数据管理需要人工干预维护
  6. 高并发的键值访问
  7. Blob 或者文档存储

本章参考

[1]. Greenplum 数据库架构分析及 5.x 新功能分享 http://blog.sina.com.cn/s/blog_12c856e4c0102yhek.html

[2]. Superset:Airbnb’s data exploration platform

[3]. Pinot 架构介绍 https://www.jianshu.com/p/67a9156f041a

[4]. impala 的原理架构介绍及应用场景 https://blog.csdn.net/javajxz008/article/details/50523332

[5]. Presto 架构及原理 https://www.cnblogs.com/tgzhu/p/6033373.html

[6]. LinkedIn Pinot 初探 https://blog.talkingdata.net/?p=3169

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文