当前位置：文江博客话题详情

逐字节比较文件或读取所有字节？

发布于 2024-10-07 14:24:11 字数 361 浏览 8 评论 0原文

我遇到了这段代码 http://support.microsoft.com/kb/320348 这让我想知道比较两个文件以确定它们是否不同的最佳方法是什么。

主要思想是优化我的程序，该程序需要验证是否有任何文件相等或不创建已更改文件和/或要删除/创建的文件的列表。

目前，我正在比较文件的大小，如果它们匹配，我将进入这 2 个文件的 md5 校验和，但是在查看了这个问题开头链接的代码后，我想知道是否真的值得使用它创建两个文件的校验和（基本上是在获得所有字节之后）？

另外，我还应该进行哪些其他验证来减少检查每个文件的工作？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

苄①跕圉湢 2024-10-14 14:24:11

将两个文件读入针对读取进行优化的小型缓冲区（4K 或 8K），然后比较针对比较进行优化的内存缓冲区（逐字节） 。

这将为您在所有情况下提供最佳性能（差异在于开始、中间或结束时）。

当然，第一步是检查文件长度是否不同，如果是这样，文件确实不同。

回复收藏 0 原文

日裸衫吸 2024-10-14 14:24:11

如果您还没有计算文件的哈希值，那么您不妨进行适当的比较（而不是查看哈希值），因为如果文件相同，则工作量相同，但如果文件不同，您就可以计算文件的哈希值。可以更早停止。

当然，一次比较一个字节可能有点浪费——一次读取整个块并比较它们可能是个好主意。

回复收藏 0 原文

~没有更多了~

关于作者

清眉祭

暂无简介

文章

25 人气

关注发私信

Promise

文章 0 评论 0

关注

qq_lbRlsh

文章 0 评论 0

关注

待＂谢繁草

文章 0 评论 0

关注

yy2010hell

文章 0 评论 0

关注

漫无边际

文章 0 评论 0

关注

傲娇萝莉攻

文章 0 评论 0

友情链接

文江博客

逐字节比较文件或读取所有字节？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签