GZipStream 和 DeflateStream 生成更大的文件

发布于 2024-09-26 07:49:14 字数 603 浏览 11 评论 0原文

我正在尝试在 C# 中使用 deflate/gzip 流，但压缩后的文件似乎比以前更大。

例如，我压缩了 900ko 的 docx 文件，但它生成了 1.4Mo 的文件！

它对我尝试过的每个文件都执行此操作。

也许我的做法是错的？这是我的代码：

  FileStream input = File.OpenRead(Environment.CurrentDirectory + "/file.docx");
  FileStream output = File.OpenWrite(Environment.CurrentDirectory + "/compressedfile.dat");

  GZipStream comp = new GZipStream(output, CompressionMode.Compress);

  while (input.Position != input.Length)
      comp.WriteByte((byte)input.ReadByte());

  input.Close();

  comp.Close(); // automatically call flush at closing
  output.Close();

原文

I'm trying to use deflate/gzip streams in C# but it appears that the files after compression are bigger than before.

For example, I compress a docx file of 900ko, but it produce a 1.4Mo one !

And it does it for every file I tried.

May be I am wrong in the way I'm doing it? Here is my code :

  FileStream input = File.OpenRead(Environment.CurrentDirectory + "/file.docx");
  FileStream output = File.OpenWrite(Environment.CurrentDirectory + "/compressedfile.dat");

  GZipStream comp = new GZipStream(output, CompressionMode.Compress);

  while (input.Position != input.Length)
      comp.WriteByte((byte)input.ReadByte());

  input.Close();

  comp.Close(); // automatically call flush at closing
  output.Close();

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

可遇━不可求 2024-10-03 07:49:14

这么大的差异对我来说似乎很奇怪，但你应该记住，docx本身是在ZIP中压缩的，所以没有理由再次压缩它，结果通常会更大。

回复收藏 0 原文

过潦 2024-10-03 07:49:14

首先，与 zip、7z 等相比，deflate/gzip 流的压缩效果非常差。

其次，docx（以及所有末尾带有“x”的 MS 文档格式）无论如何都只是 .zip 文件。将 .docx 重命名为 .zip 以揭示烟雾和镜子。

因此，当您在 docx 上运行 deflate/gzip 时，它实际上会使文件变得更大。（这就像对高压缩级别的压缩文件进行低压缩级别的 zip 操作一样。）

但是，如果您对 HTML、文本文件或未压缩的文件运行 deflate/gzip，那么它实际上会做一个漂亮的效果。好工作。

回复收藏 0 原文

美煞众生 2024-10-03 07:49:14

尽管正如其他人指出的那样，您指定的示例文件确实已经被压缩 - 最大的问题是要了解，与大多数压缩实用程序不同，DeflateStream 和 GZipStream类只是尝试标记/压缩数据流，而不知道所有附加标记（开销）实际上会增加所需的数据量。 Zip、7z 等足够聪明，知道如果数据很大程度上是随机熵（实际上不可压缩），它们只是“按原样”存储数据（存储，不压缩），而不是尝试进一步压缩它。

回复收藏 0 原文

等数载，海棠开 2024-10-03 07:49:14

我在压缩包含 jpg 数据的数据库时遇到了同样的问题。我尝试了 dotnetzip - 替代品下降并获得了不错的压缩（也支持紧凑框架！）：

MS : 10MB -> 10.0MB
DNZ: 10MB ->  7.6MB

I had the same issue with compressing databases containing jpg data. I tried dotnetzip - a drop in replacement and got decent compression (Supports Compact Framework too!):