文章来源于网络收集而来，版权归原创者所有，如有侵权请及时联系！

1. 可靠性、可扩展性、可维护性

发布于 2024-08-24 16:53:18 字数 1345 浏览 0 评论 0 收藏 0

互联网做得太棒了，以至于大多数人将它看作像太平洋这样的自然资源，而不是什么人工产物。上一次出现这种大规模且无差错的技术，你还记得是什么时候吗？
——阿兰·凯在接受 Dobb 博士杂志采访时说（2012 年）

现今很多应用程序都是 数据密集型（data-intensive） 的，而非 计算密集型（compute-intensive） 的。因此 CPU 很少成为这类应用的瓶颈，更大的问题通常来自数据量、数据复杂性、以及数据的变更速度。

数据密集型应用通常由标准组件构建而成，标准组件提供了很多通用的功能；例如，许多应用程序都需要：

数据库（database）

存储数据，以便自己或其他应用程序之后能再次找到

缓存（cache）

记住开销昂贵操作的结果，加快读取速度

搜索索引（search indexes）

允许用户按关键字搜索数据，或以各种方式对数据进行过滤

流处理（stream processing）

向其他进程发送消息，进行异步处理

批处理（batch processing）

定期处理累积的大批量数据

如果这些功能听上去平淡无奇，那是因为这些 数据系统（data system） 是非常成功的抽象：我们一直不假思索地使用它们并习以为常。绝大多数工程师不会幻想从零开始编写存储引擎，因为在开发应用时，数据库已经是足够完美的工具了。

但现实没有这么简单。不同的应用有着不同的需求，因而数据库系统也是百花齐放，有着各式各样的特性。实现缓存有很多种手段，创建搜索索引也有好几种方法，诸如此类。因此在开发应用前，我们依然有必要先弄清楚最适合手头工作的工具和方法。而且当单个工具解决不了你的问题时，组合使用这些工具可能还是有些难度的。

本书将是一趟关于数据系统原理、实践与应用的旅程，并讲述了设计数据密集型应用的方法。我们将探索不同工具之间的共性与特性，以及各自的实现原理。

本章将从我们所要实现的基础目标开始：可靠、可扩展、可维护的数据系统。我们将澄清这些词语的含义，概述考量这些目标的方法。并回顾一些后续章节所需的基础知识。在接下来的章节中我们将抽丝剥茧，研究设计数据密集型应用时可能遇到的设计决策。

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据