如何查找单个 zlib 文件中有多少个 zlib 文件？

发布于 2024-09-14 15:25:10 字数 223 浏览 12 评论 0原文

我想知道如何确定单个文件中包含多少个 zlib 文件。

一个例子；认为我有 5 个不同的文件，并使用 zlib 分别压缩它们。然后我把它们结合起来。所以，我有一个文件包含 5 个不同的 zlib 文件。现在，我如何找到该单个文件中有多少个 zlib 文件？我只需要找出单个文件中 zlib 文件的数量。我想，我需要转储它的十六进制代码并 grep 一些幻数，但不知道如何做到这一点。

你能帮我一下吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

冰雪梦之恋 2024-09-21 15:25:10

块的长度不存储在 zlib 编码数据中（除外）非压缩块）。相反，块的结束由流中的令牌 [256] 表示。但是这个令牌是霍夫曼编码的，并且霍夫曼编码通常是动态生成的所以每个块的值可能不同。此外，编码的令牌可能从字节的任何位开始，因此无法“grep”它。找到块标记末尾的唯一方法是解码整个块并检查何时击中此标记。

我认为您应该查看您的容器是否包含任何长度信息，并使用它来找出压缩数据的长度。

有关 zlib 格式的详细信息，请参阅 RFC 1950 以及相关的 DEFLATE 规范是 RFC 1951。

回复收藏 0 原文

我乃一代侩神 2024-09-21 15:25:10

如果您的单个文件是多个 gzip 文件的串联，那么您可以找到文件数量的上限。 Gzip 格式以神奇的 0x1f8b 开头。

统计单个文件中魔法的出现次数。该计数表明您最多有那么多文件。不幸的是，这是一个上限，而不是确切的文件数量。因为 0x1f8b 也可能偶然出现在数据部分 64K 字节中的 1 个。要将错误匹配数减少到大约 2400 万字节中的 1 个，您可以改为扫描 0x1f8b08。尾随的 0x08 是“压缩方法”字段，始终为 8。

可以进一步细化此“过滤器”。参见RFC1952的FLG字段。

如果单个文件的成员不是 gzip 格式，而是 Zlib 或 raw 格式，那么你就不走运了；你必须解压缩来计算文件的数量——无论如何我都会这样做。

回复收藏 0 原文

~没有更多了~