散列图像二进制 - 使用多少字节数组?

发布于 2024-12-14 09:38:06 字数 171 浏览 1 评论 0原文

我想对已转换为字节数组的图像进行哈希处理。过程越快越好,所以我想知道我真正需要将多少 300000 元素字节数组输入哈希函数(在本例中为 sha1)才能获得唯一的哈希字符串?有谁知道在图像二进制文件中,第一个 x 块是否都是元数据?我可以使用一个神奇的索引号来代替字节数组的全长吗?前任。只对第一个 [5000] 进行哈希处理。

I would like to hash images, which have been converted to byte arrays. The faster the process, the better, so I was wondering how much of a 300000 element byte array I really need to feed into the hash function (sha1 in this case) to get a unique hash string? Does anybody know if, in image binaries, the first x chunk is all meta data? Is there a magic index number that I can use instead of the full length of the byte array? Ex. only hash the first [5000].

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

寄居者 2024-12-21 09:38:06

我的观点是,这是每个图像具有唯一散列的概率的问题。如果仅使用 300000 字节图像的前 5000 字节,则仅下部不同的两个图像可能具有相同的哈希值。这不一定是sha1的问题。

您还可以将 5000 字节平均分配到 300000 字节上。

My opinion is that this is a matter of the probability of having a unique hash for each image. If you use only the first 5000 bytes of a 300000 bytes image, then two images only differing in their lower part would probably have the same hash. This is not necessarily a matter of sha1.

You could also distribute your 5000 bytes evenly over the 300000 bytes.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文