当前位置：文江博客话题详情

为什么 DMBS 不能依赖操作系统缓冲池？

发布于 2024-09-07 18:01:39 字数 495 浏览 5 评论 0原文

Stonebraker 的论文 (操作系统支持数据库管理）解释说，“从缓冲池管理器获取块的开销通常包括系统调用和核心到核心移动的开销。”忘记缓冲区替换策略等。我唯一质疑的一点是引用的内容。

我的理解是，当 DBMS 想要读取块 x 时，它会发出通用读取指令。与任何其他请求读取的应用程序应该没有区别。

我不是在寻找通用答案（我得到了它们，并阅读了论文）。我寻求所描述问题的详细答案。请参阅是否从 Java 读取文件应用程序调用系统调用？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

墨落成白 2024-09-14 18:01:39

阅读您的其他问题，并继续前进：

当 DBMS 必须从磁盘获取一页时，它将涉及至少一个系统调用。在他看来，大多数 DBMS 都会将页面放入它们自己的缓冲区中。（它们最终也会进入操作系统的缓冲区，但这并不重要）。

所以，我们有一个系统调用。但是，我们可以避免任何进一步的系统调用。这是可能的，因为 DBMS 在其自己的内存空间中缓存页面。当 DBMS 决定需要一个页面时，它要做的第一件事就是检查它的缓存中是否有该页面。如果存在，它会从那里检索它，而无需调用系统调用。

DBMS 可以以最有利于其 IO 需求的方式自由地使缓存中的页面过期。操作系统的缓存以更一般的方式过期，因为操作系统还有其他事情需要担心。其中一个例子是，DBMS 通常会使用大量内存来缓存页面，因为它知道磁盘 IO 是它能做的最昂贵的事情之一。操作系统不会这样做，因为它必须平衡磁盘 IO 的成本和供其他应用程序使用的内存。

回复收藏 0 原文

栖迟 2024-09-14 18:01:39

操作系统磁盘 I/O 必须通用才能适用于各种情况。 DBMS 有时可以使用针对其自身需求进行优化的不太通用的代码来获得显着的性能。

DBMS 进行自己的缓存，因此不想通过 O/S 缓存进行工作。它“拥有”磁盘补丁，因此不需要担心与其他进程共享。

更新
该论文的链接是有帮助的。

首先，这篇论文已经有近三十年的历史了，并且涉及的是早已过时的硬件。尽管如此，读起来还是很有趣的。

首先，了解磁盘 I/O 是一个分层过程。那是1981年，现在更是如此。在最低点，设备驱动程序将向硬件发出物理读/写指令。上面可能是操作系统内核代码，然后是操作系统用户空间代码，然后是应用程序。在 C 程序的 fread() 和磁盘头移动之间，至少有三到四个级别，甚至可能更多。 DBMS 可能会寻求提高性能，可能会寻求绕过某些层并直接与内核对话，甚至更低。

我记得几年前在 Sun 机器上安装了 Oracle。它可以选择将磁盘专用为“原始”分区，Oracle 将以自己的方式格式化磁盘，然后直接与设备驱动程序对话。操作系统根本无法访问磁盘。

回复收藏 0 原文

迎风吟唱 2024-09-14 18:01:39

主要是性能问题。 dbms 具有高度特定且不寻常的 I/O 需求。

操作系统可能有任意数量的进程执行 I/O 并用由此产生的各种缓存数据填充其缓冲区。

当然，还存在大小和缓存内容的问题（与更通用的设备缓冲区缓存相比，dbms 可能能够根据其需要执行更好的缓存）。

还有一个问题是，通用“块”实际上可能比 dbms 理想情况下承受的 I/O 负担大得多（这取决于分区等）；它自己的缓存可以调整为更好地适应磁盘上数据的布局，从而能够最大限度地减少 I/O。

进一步的问题是索引和类似的加速查询的方法的问题，如果缓存实际上知道首先意味着什么，那么效果当然会更好。

回复收藏 0 原文

北恋 2024-09-14 18:01:39

真正的问题是文件缓冲区缓存不在 DBMS 使用的文件系统中；它位于内核中并由驻留在系统中的所有文件系统共享。从内核读取的任何内存都必须复制到用户空间：这是您读到的核心到核心的移动。

除此之外，还有一些不能依赖系统缓冲池的其他原因：

通常，DBMS 对于即将到来的访问模式有一个很好的了解，但它无法将这些模式传达给内核。这可能会导致性能下降。
缓冲区高速缓存传统上存储在固定大小的内核内存范围中，因此它不能增长或缩小。这也意味着缓存比主内存小得多，因此通过使用缓冲区缓存，DBMS 将无法利用系统资源。

回复收藏 0 原文

仅此而已 2024-09-14 18:01:39

我知道这已经很旧了，但它没有得到答复。

本质上：

操作系统为每个进程使用单独的地址空间。
从任何其他地址空间检索信息都需要系统调用或页面错误。 **（见下文）
DBMS 是一个拥有自己的地址空间的进程。
Stonebraker 描述的操作系统缓冲池位于内核地址空间中。

因此，为了将数据从内核地址空间获取到 DBMS 的地址空间，系统调用或页面错误是不可避免的。

您是对的，从操作系统缓冲池管理器访问数据并不比普通的 read() 调用更昂贵。（事实上，这是通过正常的读取调用完成的。）但是，Stonebraker 并没有谈论这一点。他专门讨论了数据从磁盘读取并存在于 RAM 中之后的 DBMS 的缓存需求。

本质上，他是说操作系统的缓冲池缓存对于 DBMS 来说太慢而无法使用，因为它存储在不同的地址空间中。他建议在同一进程中使用本地缓存（因此也是相同的地址空间），这可以为像 DBMS 这样对缓存造成严重影响的应用程序提供显着的加速，因为它将消除系统调用开销。

这是他讨论在同一进程中使用本地缓存的确切段落：

但是，包括 INGRES 在内的许多 DBMS
[20] 和 System R [4] 选择放置一个
用户空间中的 DBMS 管理的缓冲池
以减少开销。因此，每个
这些系统已经转到
自己建造的麻烦
缓冲池管理器增强
性能。

他还在上面引用的摘录中提到了多核问题。类似的效果也适用于此，因为如果每个核心只有一个缓存，那么当多个 CPU 读取和写入相同数据时，您也许能够避免 CPU 缓存刷新造成的速度减慢。

** 顺便说一句，我相信 Stonebraker 1981 年的论文实际上是 mmap 之前的论文。他提到这是未来的工作。 “将文件系统作为共享虚拟内存的一部分提供的趋势（例如，Pilot [16]）可能会为这个问题提供解决方案。”

I know this is old, but it came up as unanswered.

Essentially:

The OS uses a separate address spaces for every process.
Retrieving information from any other address space requires a system call or page fault. **(see below)
The DBMS is a process with its own address space.
The OS buffer pool Stonebraker describes is in the kernel address space.

So ... to get data from the kernel address space to the DBMS's address space, a system call or page fault is unavoidable.

You're correct that accessing data from the OS buffer pool manager is no more expensive than a normal read() call. (In fact, it's done with a normal read call.) However, Stonebraker is not talking about that. He's specifically discussing the caching needs of DBMSes, after the data has been read from the disk and is present in RAM.

In essence, he's saying that the OS's buffer pool cache is too slow for the DBMS to use because it's stored in a different address space. He's suggesting using a local cache in the same process (and therefore same address space), which can give you a significant speedup for applications like DBMSes which hit the cache heavily, because it will eliminate that syscall overhead.

Here's the exact paragraph where he discusses using a local cache in the same process:

However, many DBMSs including INGRES
[20] and System R [4] choose to put a
DBMS managed buffer pool in user space
to reduce overhead. Hence, each of
these systems has gone to the
trouble of constructing its own
buffer pool manager to enhance
performance.

He also mentions multi-core issues in the excerpt you quote above. Similar effects apply here, because if you can have just one cache per core, you may be able to avoid the slowdowns from CPU cache flushes when multiple CPUs are reading and writing the same data.

** BTW, I believe Stonebraker's 1981 paper is actually pre-mmap. He mentions it as future work. "The trend toward providing the file system as a part of shared virtual memory (e.g., Pilot [16]) may provide a solution to this problem."

回复收藏 0 原文

~没有更多了~