Java - 计算文件压缩

发布于 2024-12-25 08:59:05 字数 188 浏览 1 评论 0原文

有没有办法获得仅读取文件的可能压缩率？
您知道，有些文件比其他文件更容易压缩...我的软件必须告诉我文件可能压缩的百分比。

例如
压缩比：50% ->如果压缩，我可以节省 50% 的文件空间
压缩率：99% ->如果压缩，我只能节省 1% 的文件空间

需要登录才能够评论，你可以免费注册一个本站的账号。

明月松间行 2025-01-01 08:59:05

首先，这很大程度上取决于您选择的压缩方法。其次，我严重怀疑如果不计算与实际进行压缩相当的时间和空间复杂性，这是可能的。我想说你最好的选择是压缩文件，跟踪你已经生成的文件的大小并删除/释放它（显然，一旦你完成了它）而不是写出来。

要真正做到这一点，除非您真的想自己实现它，否则使用 java.util.zip 类，特别是 Deflater 类及其 deflate 方法。

秋风の叶未落 2025-01-01 08:59:05

首先，您需要研究信息论。关于信息论领域有两种理论：

根据香农的说法，可以通过使用源的符号概率来计算源的熵（即压缩大小）。因此，由统计模型定义的最小压缩大小，该统计模型在每一步都会产生符号概率。所有算法都隐式或显式地使用该方法来压缩数据。请参阅维基百科文章了解更多详细信息。
根据柯尔莫哥洛夫的说法，可以通过找到生成源代码的最小可能程序来找到最小的压缩大小。从这个意义上说，它是不可计算的。有些程序部分使用这种方法来压缩数据（例如，您可以编写一个小型控制台应用程序，它可以生成 100 万位 PI，而不是压缩这 100 万位 PI）。

因此，如果不评估实际压缩，您就无法找到压缩大小。但是，如果您需要近似值，您可以依靠香农的熵理论并构建一个简单的统计模型。这是一个非常简单的解决方案：