有没有办法用 epsilon 获取浮点数的哈希码？

发布于 2024-07-14 06:13:53 字数 923 浏览 7 评论 0原文

众所周知，通过 == 比较浮点数通常是错误的。在我编写的 3D 向量类（具有浮点分量 X、Y、Z）中，如果两个向量的距离被视为零，则它们被视为相等。

public override bool Equals(object obj)
{
    if (obj == null) {
        return false;
    }

    if (GetType () != obj.GetType ()) {
        return false;
    }

    float d = DistSq ((Vec) obj);

    return IsConsideredZero (d);
}

public float DistSq(Vec p)
{
    Vec d = this - p;
    return d.LengthSq ();
}

public float LengthSq()
{
    return X * X + Y * Y + Z * Z;
}

private const float VEC_COMPARE_EPSILON_ABS = 1E-05f;
public static bool IsConsideredZero(float f)
{
    return Math.Abs (f) < VEC_COMPARE_EPSILON_ABS;
}

到目前为止，一切正常。但是，现在我想获取向量的哈希码。我可以看到像 hash = (int)X^(int)Y^(int)Z 这样的东西一定会失败。

我能想到的最好的办法是：

public override int GetHashCode()
{
    return 0;
}

这当然有点糟糕。有没有办法获得合理的哈希码？ NaN 和其他特殊值是可能的，但不太可能，以防万一这很重要。

原文

It is well known that comparing floats by == is usually a mistake. In a 3D-vector class (with float components X, Y, Z) i wrote, two vectors are considered equal if their distance is considered zero.

public override bool Equals(object obj)
{
    if (obj == null) {
        return false;
    }

    if (GetType () != obj.GetType ()) {
        return false;
    }

    float d = DistSq ((Vec) obj);

    return IsConsideredZero (d);
}

public float DistSq(Vec p)
{
    Vec d = this - p;
    return d.LengthSq ();
}

public float LengthSq()
{
    return X * X + Y * Y + Z * Z;
}

private const float VEC_COMPARE_EPSILON_ABS = 1E-05f;
public static bool IsConsideredZero(float f)
{
    return Math.Abs (f) < VEC_COMPARE_EPSILON_ABS;
}

So far, everything worked fine. However, now i'd like to get a hashcode of the vector. I can see that something like hash = (int)X^(int)Y^(int)Z is bound to fail.

The best i could come up with was:

public override int GetHashCode()
{
    return 0;
}

This, of course, kind of sucks. Is there any way to get a reasonable hashcode? NaNs and other special values are possible, but unlikely, in case that is important.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

￠好甜 2024-07-21 06:13:53

假设您想要具有正常的哈希码/相等属性是不可能的：

如果 X = Y 且 Y = Z 则 X = Z（传递性）
如果 X = Y 则 Y = X（交换性）
对于所有 X，X = X（自反性

）第一条规则是问题所在 - 因为如果每个值都被视为“等于”下一个更大的可表示数字，那么最终的结果是所有数字都相等。例如，假设一个数字被认为等于另一个数字，它们在 0.1 之内：

0 等于 0.08
0.08 等于 0.16
0.16 等于 0.24

=> 根据传递性规则 0 等于 0.16
=> 根据传递性规则，0 等于 0.24

（等等）

如果您忽略传递性规则，那么您仍然（大概）希望“相等”值具有相等的哈希码。这有效地强制执行了传递性规则 - 在上面的示例中，0 和 0.08 必须具有相同的哈希码，0 和 0.16 也是如此。因此 0 和 0.16 必须具有相同的哈希码，依此类推。因此，你不能有有用的哈希码 - 它必须是一个常量。

回复收藏 0 原文

紫瑟鸿黎 2024-07-21 06:13:53

我认为您不能拥有与您的比较方法一致的哈希码，因为后者不可传递：对于任何三个向量 A、B、C，如果 A.Equals(B) 和 < code>B.Equals(C) 为 true，但 A.Equals(C) 仍可能为 false。（想象一下，如果 A 和 B 之间的距离是 6e-6，B 和 C 之间的距离是 6e-6，A 和 C 之间的距离是 1.2e-5）但是哈希码的相等性始终是可传递的，因为它们只是数字。

在这种情况下，我只是创建一个 hashcode 方法，根据浮点坐标的精确值计算哈希值，并在文档中提到它与 equals 不一致。我知道这并不是一个真正的解决方案，但考虑到我认为不存在真正的解决方案，拥有一个不平凡的哈希码比只有 0 更好。

回复收藏 0 原文

萌无敌 2024-07-21 06:13:53

恐怕不是一般情况。证明的草图如下：

取任意两个数 a 和 b。设它们之间的差为d。然后，如果您创建 d/epsilon 数字，中间有一个 epsilon 步骤，则每个步骤必须“等于”之前的步骤，根据哈希码语义，其具有相同的哈希码。因此所有数字必须具有相同的哈希码。

只有添加一些其他约束才能解决这个问题。

顺便说一句，您对 Equals 的定义也是错误的，因为 a.Equals(b) 和 b.Equals(c) 可能是正确的，但 a.Equals(c) 不是，这对于 equals 来说是错误的。这称为破坏传递性属性。

那我能做什么呢？

解决方案取决于您使用哈希的目的。一种解决方案是引入概念网格。更改 equals 和 hashcode，以便在同一网格立方体中的两个数字相等，方法是四舍五入到恒定的小数位数，然后对四舍五入的数字取 equals 和 hashcode。如果接近零是一个重要情况，请在舍入之前添加 epsilon/2 的偏移量，这样零就是立方体的中心。这是正确的，但是两个数字可以任意接近（在浮点数的限制下）而不相等。因此，对于某些应用程序来说可以，但对于其他应用程序则不行。这类似于 mghie 的想法。

回复收藏 0 原文