当前位置：文江博客话题详情

哪些压缩/归档格式支持文件间压缩？

发布于 2024-07-07 17:35:05 字数 301 浏览 8 评论 0原文

这个问题关于归档 PDF 的让我想知道 - 如果我想压缩（出于归档目的）大量文件，而这些文件本质上是在主模板（信头）之上进行的小更改，那么似乎可以获得巨大的压缩增益具有文件间压缩功能。

标准压缩/归档格式是否支持此功能？ AFAIK，所有流行的格式都专注于压缩每个单个文件。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

信仰 2024-07-14 17:35:05

有几种格式可以进行文件间压缩。

最古老的例子是 .tar.gz； .tar 没有压缩，但将所有文件连接在一起，每个文件前面都有标头，而 .gz 只能压缩一个文件。两者都是按顺序应用的，这是 Unix 世界的传统格式。 .tar.bz2 是相同的，只是用 bzip2 而不是 gzip。

最近的示例是具有可选“固体”压缩的格式（例如 RAR 和 7-Zip），如果通过命令行标志或 GUI 选项启用，它们可以在压缩之前在内部连接所有文件。

回复收藏 0 原文

满天都是小星星 2024-07-14 17:35:05

看看google的open-vcdiff。

http://code.google.com/p/open-vcdiff/

设计用于计算小型压缩增量并实现 RFC 3284。

http://www.ietf.org/ rfc/rfc3284.txt

微软有一个 API 可以做类似的事情，但没有任何标准的外表。

一般来说，您正在寻找的算法是基于 Bentley/McIlroy 的算法：

http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.11.8470

特别是，如果模板的大小大于窗口大小（ ~32k) gzip 使用的块大小 (100-900k) bzip2 使用的块大小 (100-900k)。

Google 在其 BIGTABLE 实现内部使用它们来存储压缩网页，其原因与您查找它们的原因大致相同。

回复收藏 0 原文

贵在坚持 2024-07-14 17:35:05

由于 LZW 压缩（几乎他们都使用）涉及在您进行过程中构建一个重复字符表，例如您想要的模式将限制您必须立即解压缩整个存档。

如果这在您的情况下是可以接受的，那么实现一种在压缩之前将文件合并成一个大文件的方法可能会更简单。

回复收藏 0 原文

~没有更多了~

关于作者

失退

暂无简介

0 文章

0 评论

22 人气

关注发私信

1CH1MKgiKxn9p

文章 0 评论 0

关注

ゞ记忆︶ㄣ

文章 0 评论 0

关注

JackDx

文章 0 评论 0

关注

信远

文章 0 评论 0

关注

yaoduoduo1995

文章 0 评论 0

关注

霞映澄塘

文章 0 评论 0

友情链接

文江博客

哪些压缩/归档格式支持文件间压缩？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签