大对象堆友好的 IDictionary

发布于 2024-11-05 14:42:59 字数 558 浏览 7 评论 0原文

我们有一个应用程序，在多个字典中保存大量对象，其中一些对象在应用程序的生命周期中不断增长（具有大量工具和不断增长的订单/交易的交易应用程序）。

由于大对象堆的碎片，我们遇到了 OutOfMemoryException 问题。

为了解决这个问题，我尝试编写一个“大”字典，它作为两级字典实现，其中所有叶字典都不够大，无法在 LOH 上分配。我使用了一致的哈希算法来避免在单个存储桶变得太大时必须重新哈希整个字典。一致哈希“圆”是来自 C5 集合库的 TreeDictionary。

我的问题是，C# 是否有更好的数据结构（或者可能是我所描述的数据结构的更好实现）？

更新

这是“大”字典的实现：https://gist.github.com/956621

我知道这并不是万无一失的，因为规范中既没有 LOH 堆阈值，也没有每个字典条目或缩放算法的大小。然而，这是目前我能想到的最好的避免应用程序在中午崩溃的方法。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

极致的悲 2024-11-12 14:42:59

当字典是应用程序中最大的数据结构时，它是一种不幸的数据结构。当哈希表变得太满时，哈希表的大小通常会增加一倍，并且在调整大小期间（就在关键时刻）需要 150% 的过度分配。当哈希表很大时，它的工作效果非常好，但它需要连续分配，这会给堆算法带来压力。

您可以使用多级哈希表来消除这些缺点，例如使用哈希码的一个字节作为 256 个哈希表的索引。这肯定会增加一些开销，但更重要的是，这种策略和其他策略充满了危险，因为它会破坏随机性（例如您获得的哈希码），并可能使性能变得非常糟糕。使用这种方法需要良好的理论基础和扎实的实证检验。但它可以发挥作用。

另一种策略是为最坏的情况预先分配最大的数据结构并尽早分配。不需要细粒度的分配，但现在如果它用完，您将面临灾难性故障的幽灵。这是一个选择。

回复收藏 0 原文

┼── 2024-11-12 14:42:59

我认为这需要改变算法。

据我了解和了解，GC在内存打包和碎片整理方面相当擅长。所以你的问题源于一个简单的事实，即你在内存中保存了太多的数据。

您在内存中保存了多少数据？

您考虑过使用数据库吗？紧凑的一个可能就足够了。

或者简单地告诉您的客户，要正确运行您的应用程序，他需要 16 GB 内存。如果您的应用程序需要全部 16 GB 内存，那么肯定有问题。

编辑：
从不同的角度看你的问题，在阅读你的编辑后，我得到了一个问题：你的物体有多大？或者它们包含长列表或数组？您多久删除/添加这些对象一次？

我认为问题可能不在于字典本身，而在于太大并且被删除/添加过于频繁的对象。也许使用某种捕捉或池可能会有利可图。如果您使用列表，则使用预先分配的方式创建这些列表。

也许使用不可变结构而不是可变类可以减轻碎片。

回复收藏 0 原文

~没有更多了~

关于作者

征﹌骨岁月お

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

大对象堆友好的 IDictionary

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

知足的幸福

我一向站在原地

慕烟庭风

秉忠贞之诚守退让之实

小兔几

mb_3y7WUgWY

友情链接

大对象堆友好的 IDictionary

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

知足的幸福

我一向站在原地

慕烟庭风

秉忠贞之诚 守退让之实

小兔几

mb_3y7WUgWY

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

秉忠贞之诚守退让之实