当前位置：文江博客话题详情

ConcurrentHashMap构造函数参数？

发布于 2024-08-07 09:43:03 字数 476 浏览 2 评论 0原文

我想知道构造 ConcurrentHashMap 的参数：

initialCapacity 默认情况下为 16（已理解）。
loadFactor 默认为 0.75。
concurrencyLevel 默认情况下为 16。

我的问题是：

应该使用什么标准来向上或向下调整 loadFactor ？
我们如何确定并发更新线程的数量？
应该使用什么标准来调整 concurrencyLevel 向上或向下？

另外：

良好哈希码实现的特点是什么？（如果某个问题解决了这个问题，只需链接到它。）

谢谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

与君绝 2024-08-14 09:43:03

简短的答案：将“初始容量”设置为您希望在地图中放入的映射数量，并将其他参数保留为默认值。

长答案：

负载因子是
地图中“桶”的数量以及
预期元素的数量；
0.75 通常是一个合理的折衷方案——我记得，这意味着
良好的哈希函数，平均而言我们
预计大约 1.6 重定向才能找到
地图中的元素（或该图周围）；
- 改变负载
  因素改变了之间的折衷
  更多重定向来查找元素，但是
  更少的浪费空间——设置 0.75 是
  通常确实物有所值；
- 原则上将ConcurrencyLevel设置为
  您的并发线程数
  期望修改地图，
  虽然高估这并不
  似乎对其他方面有不好的影响
  而不是浪费内存（我写了一点
  关于ConcurrentHashMap 性能
  不久前，以防你
  有兴趣）

非正式地说，您的散列函数本质上应该旨在使位中具有尽可能多的“随机性”。或者更严格地说，给定元素的哈希码应该为每个位提供大约 50% 的被设置的机会。实际上用一个例子来说明这一点更容易：同样，您可能对我写的一些关于字符串哈希函数的工作原理以及相关的哈希函数指南。显然欢迎对任何这些东西提供反馈。

我在某些时候还提到的一件事是，您在实践中不必过于偏执：如果您的哈希函数在某些位中产生“合理”数量的随机性，那么它将经常会没事。在最坏的情况下，将代表性的数据片段粘贴到字符串中并获取字符串的哈希码实际上并没有那么糟糕。

回复收藏 0 原文

独享拥抱 2024-08-14 09:43:03

负载因子主要与哈希函数的质量有关。负载因子越接近零，即使散列函数不是很好，发生冲突的可能性也越小。代价是内存占用更大。换句话说，HashMap 不会为每个单独的哈希码将条目分布在单独的存储桶中，而是按邻近度对它们进行分组，因此它拥有的存储桶越多，分布就越分散，发生冲突的可能性就越小。

因此，最重要的是，根据您的需求和存储在映射中的对象，调整负载因子以缩短查找时间或减少内存。

并发级别实际上取决于您的应用程序。如果应用程序中只运行两个或三个线程，那就这样吧。如果你是一个具有任意数量线程的应用服务器，那么你需要了解你的负载能力是多少以及你想要优化的点。

高质量的哈希码实现可以在遵守合同的同时，以最少的冲突次数在对象的潜在值之间提供尽可能广泛的分布。换句话说，它允许 HashMap（或 Set，视情况而定）将对象分布到单独的存储桶中，从而加快查找速度。

回复收藏 0 原文

娇柔作态 2024-08-14 09:43:03

loadFactor：控制实现决定何时调整哈希表的大小。值太高会浪费空间；太低的值将导致昂贵的调整大小操作。

concurrencyLevel：告诉实现尝试针对给定数量的写入线程进行优化。根据 API 文档，最多 10 倍的偏差不会对性能产生太大影响。

允许的更新并发数
操作由可选的指导
concurrencyLevel 构造函数参数
（默认16），用作提示
用于内部尺寸调整。该表是
内部分区尝试
允许指定数量的
无争用的并发更新。
因为哈希表中的放置是
本质上是随机的，实际
并发度会有所不同。理想情况下，你
应该选择一个值来容纳
尽可能多的线程
同时修改表。使用
明显高于你的价值
需要会浪费空间和时间，并且
显着降低值可能会导致
线程争用。但高估了
并在一个顺序内低估
幅度通常没有太大
影响显着。