使用 64 位类型？

发布于 2024-10-12 03:37:06 字数 590 浏览 10 评论 0原文

我正在为编译器编写一些哈希函数，并且经常使用 __int64 数据类型。该编译器旨在支持（到目前为止）不同操作系统的支持。我知道 __int64 是一种可以由大多数主要 C++ 编译器针对我的目标系统进行编译的类型，因此这不是问题。我正在使用散列函数来使大字符串变得更小并更快地进行比较，它们在 64 位操作系统上发挥了神奇作用；但是 32 位操作系统的性能是否会大幅下降以抵消其带来的好处？我可以使用 32 位整数，但这会大大降低哈希函数的有效性。

编辑：这是自定义代码并且非常简单。第一个哈希函数从 12 个字母数字（包括下划线）字符生成唯一的 64 位 int。然后，一个类通过创建 64 位哈希值的地址链接列表来处理超过 12 个字符的哈希值，并重载比较运算符。重载的比较被短路并沿着地址链表进行比较。我在我的机器上运行了测试，以比较随机生成大型哈希（100 - 300 个字符）与其自身（最坏情况情况）的速度，并且事实证明它比字符串比较更快。为了更好地模拟生成哈希值的开销，我还对预先生成的大型哈希值与它们本身进行了比较测试。这一切都是在代码优化关闭的情况下运行的。约 10 亿次哈希比较与约 10 亿次字符串比较，哈希花费了大约 16% 的时间。但这都是在 64 位环境中进行的。我没有 32 位机器来运行测试

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

没有心的人 2024-10-19 03:37:06

64 位大小的整数在 32 位 x86 架构上根本没有慢多少。显然，它们不如 32 位整数快，但也不是特别慢。无论 x86 还是 x64，使用 64 位 int 进行哈希值都不是鲁莽的。与一些不需要的动态分配或失败的算法相比，额外的开销可能很小。

回复收藏 0 原文

迎风吟唱 2024-10-19 03:37:06

我不认为比较四个 32 位变量会比比较两个 64 位变量更快，因为我猜编译器将生成最快的代码：如果您的处理器不支持 64 位操作，您的编译器将生成分两步进行比较的代码，就像您手动进行的操作一样。
这当然取决于您的编译器。

无论如何，还有其他工具可以使您的比较速度更快，但并非随处可用，例如矢量运算（由 SSE 扩展提供）允许一次比较甚至 8*4 字节。

如果您需要尽可能优化代码，我建议您添加一些预处理器指令，以便仅在系统支持时才启用优化。

回复收藏 0 原文

仅一夜美梦 2024-10-19 03:37:06

您确定这会大大降低哈希函数的有效性吗？你进行过测试吗？当然，如果 (i) 散列的项数明显多于 2^16 并且 (ii) 计算 64 位散列值成本较低，则 64 位散列值比 32 位值更好。对于您的情况，(i) 或 (ii)（或两者）哪一个是正确的？如果性能很重要，您可能需要根据底层操作系统使用不同的哈希函数。否则我会说：写一个32位版本，再写一个64位版本；在 64 位系统和 32 位系统上尝试它们；然后你就会知道是否值得费尽心思。

回复收藏 0 原文