当前位置：文江博客话题详情

您可以实现的随机二进制数据的最佳文件压缩是什么？

发布于 2024-10-12 21:23:34 字数 1456 浏览 2 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

日暮斜阳 2024-10-19 21:23:34

如果文件大小可以精确到位指定，则对于任何文件大小 N，将精确地存在 2^(N+1)-1 个可能的 N 位或更小的文件。为了将大小为 X 的文件映射到某个较小大小的 Y，必须将某个大小为 Y 或更小的文件映射到大小为 X 或更大的文件。无损压缩发挥作用的唯一方法是，某些可能的文件可以被识别为比其他文件更有可能；在这种情况下，可能的文件将缩小，而不太可能的文件将增大。

举一个简单的例子，假设一个人希望无损地存储一个文件，其中的位是随机且独立的，但不是 50% 的位被设置，而是只有 33% 被设置。可以通过获取每对位来压缩这样的文件，如果两个位都被清除，则写入“0”，如果设置了第一个位而第二个位未设置，则写入“10”，如果设置了第二个位而第一个位未设置，则写入“110” ，或“111”（如果两个位均已设置）。其效果是，每对比特在 44% 的情况下变为一位，在 22% 的情况下变为两位，在 33% 的情况下变为三位。虽然某些数据串会增长，但其他数据串会缩小；如果概率分布符合预期，缩小的文件对数量将超过增长的文件对（4/9 文件将缩小一点，2/9 将保持不变，3/9 将增长，因此文件对将继续存在）平均缩小 1/9 位，文件平均缩小 1/18 [因为 1/9 数字是每对位]）。

请注意，如果这些位实际上具有 50% 的分布，则只有 25% 的对将变为一位，25% 将保留两位，50% 将变为三位。因此，25% 的位将缩小，50% 的位将增长，因此平均对将增长 25%，文件将增长 12.5%。盈亏平衡点约为 38.2% 的位被设置（2 减去黄金分割），这将产生 38.2% 的位对缩小和相同百分比的增长。

回复收藏 0 原文

甜｀诱少女 2024-10-19 21:23:34

没有一种通用的最佳压缩算法。人们发明了不同的算法来处理不同的数据。

例如，JPEG 压缩允许您对图像进行大量压缩，因为图像中的红色是否为 0xFF 或 0xFE（通常）并不重要。但是，如果您尝试压缩文本文档，这样的更改将是灾难性的。

此外，即使在设计用于处理相同类型数据的两种压缩算法之间，您的结果也会根据您的数据而有所不同。

示例：有时使用 gzip tarball 较小，有时使用 bzip tarball 较小。

最后，对于足够长度的真正随机数据，您的数据可能具有几乎与原始数据相同（甚至大于）的大小。

回复收藏 0 原文

~没有更多了~

关于作者

流绪微梦

暂无简介

0 文章

0 评论

22 人气

关注发私信

友情链接

文江博客

您可以实现的随机二进制数据的最佳文件压缩是什么？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

烙印

singlesman

给自己一个微笑

独孤求败

晨钟暮鼓

我是自愿种绣球花的

友情链接

您可以实现的随机二进制数据的最佳文件压缩是什么？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

烙印

singlesman

给自己一个微笑

独孤求败

晨钟暮鼓

我是自愿种绣球花的

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。