当前位置：文江博客话题详情

写入文件和映射内存有什么区别？

发布于 2024-12-03 00:50:23 字数 623 浏览 5 评论 0原文

我有以下与处理文件和映射它们（mmap）相关的问题：

我们知道，如果我们创建一个文件并写入该文件，那么无论哪种方式我们都会写入内存。那么为什么要使用 mmap 将该文件映射到内存然后写入呢？
如果是因为我们使用 mmap 实现保护 - PROT_NONE、PROT_READ、PROT_WRITE，那么同样的还可以使用文件来实现保护级别。 O_RDONLY、O_RDWR 等。那为什么是mmap呢？
将文件映射到内存然后使用它有什么特殊的优势吗？而不是仅仅创建一个文件并写入它？
最后，假设我们将一个文件mmap到内存，如果我们写入mmap返回的内存位置，它是否也会同时写入该文件？

编辑：在线程之间共享文件

据我所知，如果我们在两个线程（而不是进程）之间共享文件，那么建议将其mmap到内存中然后使用它，而不是直接使用文件。

但我们知道使用文件意味着它肯定在主内存中，那么为什么线程又需要映射呢？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

黯然#的苍凉 2024-12-10 00:50:23

内存映射文件实际上部分或全部映射在内存 (RAM) 中，而写入的文件将先写入内存，然后刷新到磁盘。内存映射文件从磁盘中取出并显式放入内存中以供读取和/或写入。它会一直保留在那里，直到您取消映射为止。

对磁盘的访问速度较慢，因此当您写入文件时，它将被刷新到磁盘并且不再驻留在 RAM 中，这意味着下次需要该文件时，您可能会从磁盘获取它（慢），而在内存映射文件中，您知道该文件位于 RAM 中，并且可以比在磁盘上时更快地访问它。

此外，内存映射文件通常用作 IPC 机制，因此两个或多个进程可以轻松共享同一文件并对其进行读/写。（使用必要的 sycnh 机制）

当您需要经常读取文件并且该文件非常大时，将其映射到内存中可能会很有利，这样您就可以更快地访问它，然后必须打开它并从磁盘获取它每次。

编辑：

这取决于您的需求，当您有一个需要由不同线程非常频繁地访问的文件时，我不确定内存映射该文件从这个角度来看，这必然是一个好主意，如果您希望从不同线程的相同位置写入该文件，则需要同步对该文件的访问。如果这种情况经常发生，则可能会成为资源争用的地方。

只需从文件中读取，那么这可能是一个很好的解决方案，因为如果您仅从多个线程读取文件，那么您实际上并不需要同步访问。当你开始写作时，你必须使用同步机制。

我建议，如果您必须写入文件，就像处理任何其他文件一样，您可以让每个线程以线程本地方式执行自己的文件访问。通过这种方式，它减少了线程同步的需要以及难以发现和调试的错误的可能性。

回复收藏 0 原文

简单 2024-12-10 00:50:23

1）您误解了 write(2) 系统调用。 write() 不写入，它只是将缓冲区内容复制到操作系统缓冲区链并将其标记为脏。操作系统线程之一（bdflush IIRC）将拾取这些缓冲区，将它们写入磁盘并修改一些标志。之后。
使用 mmap，您可以直接访问操作系统缓冲区（但如果您更改其内容，它也会被标记为脏）

2）这与保护无关，而是与在页表条目中设置标志有关。

3）避免双缓冲。您还可以使用字符而不是块来寻址文件，这有时更实用

4) 这是您一直在使用的系统缓冲区（挂接到您的地址空间）。系统可能已将部分内容写入磁盘，也可能未将其部分写入磁盘。

5) 如果线程属于同一进程并共享页表和地址空间，则可以。

回复收藏 0 原文

北城挽邺 2024-12-10 00:50:23

一个原因可能是您将（遗留）代码设置为写入数据缓冲区，然后该缓冲区最后一次写入文件。在这种情况下，使用 mmap 将保存至少一份数据副本，因为操作系统可以直接将缓冲区写入磁盘。
只要它只是关于文件写入，我（还）无法想象您想要使用 mmap 的任何其他原因。
不，我想说保护在这里不相关。
它可能会保存一份或两份数据副本，例如从应用程序缓冲区到 libc 缓冲区再到操作系统缓冲区，请参阅第 1 点。在写入大量数据时，这可能会产生性能差异。
没有。据我所知，操作系统可以随时写入数据，只要在调用 msync 或 munmap 在该内存区域上。
（对于大多数文件来说，出于性能原因，它可能不会在大多数时间之间写入任何内容：将整个块写入磁盘，因为更改一个字节是相当昂贵的，特别是如果预计会进行更多修改的话到块将在不久的将来发生。）