当前位置：文江博客话题详情

.NET file-io binaryfiles memory-mapped-files

从巨大的二进制文件中反序列化对象的最快方法

发布于 2024-09-28 16:13:39 字数 579 浏览 9 评论 0原文

所以场景如下：我有一个 2-3 GB 的二进制序列化对象的大文件，我还有一个索引文件，其中包含每个对象的 id 及其在文件中的偏移量。

我需要编写一个方法，给定一组 id 将它们反序列化到内存中。性能是最重要的基准，保持合理的内存需求是第二个。

使用 MemoryMappedFile 似乎是可行的方法，但是我有点不确定如何处理大文件。我无法为整个文件创建 MemoryMappedViewAccessor，因为它太大了。我可以同时打开多个不同段的 MemoryMappedViewAccessor 而不会太大影响内存吗？在这种情况下，这些段应该有多大？

如果数据被大量访问然后被丢弃，视图可能会在内存中保留一段时间。

一个可能简单的方法是按偏移量排序对象，并简单地为每个偏移量使用一个小缓冲区调用 CreateViewAccessor。另一种方法是尝试找出所需的不同 MemoryMappedViewAccessor 的最少数量及其大小。但我不确定创建 CreateViewAccessor 的开销以及您可以一次性安全访问多少空间。我可以做一些测试，但如果有人有更好的主意...:)

我想另一种方法是将大数据文件分成几个，但我不确定在这种情况下会有什么好处...

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

檐上三寸雪 2024-10-05 16:13:39

文件位于什么类型的存储上？普通 HDD 还是 SSD？如果是普通硬盘，您应该最大限度地减少寻道时间，因此您可能需要按偏移量对访问进行排序。

我认为拥有大的内存映射段不会花费太多内存。它们只消耗地址空间，因为它们可以由文件本身支持。因此，使用最多的 RAM 是操作系统缓存。

据我所知，异步 IO 使用 I/O 完成端口是最快的，但我自己还没有使用过。

回复收藏 0 原文

迷途知返 2024-10-05 16:13:39

我的问题是为什么你有 2 个 3GB 的序列化对象文件？加载它总是会出现性能问题。
您真的需要立即处理所有这些信息吗？最好的方法可能是某种数据库，您可以使用它在需要时查询所需的元素并在此时重建它们。
您能否提供有关您存储的数据类型以及如何使用这些数据的更多信息。在我看来，你的设计需要做一些工作。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

饮湿

文章 0 评论 0

明月

文章 0 评论 0

02

文章 0 评论 0

hs1283

文章 0 评论 0

风向决定发型

文章 0 评论 0

落花浅忆

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文