当前位置：文江博客话题详情

理论上可能的最大压缩率是多少？

发布于 2024-09-09 08:35:36 字数 485 浏览 3 评论 0原文

这是一个理论问题，因此这里的许多细节在实践中甚至在理论上都是不可计算的。

假设我有一个要压缩的字符串 s。结果应该是一个输出 s 的自解压二进制文件（可以是 x86 汇编程序，但也可以是其他假设的图灵完备低级语言）。

现在，我们可以轻松地迭代所有可能的此类二进制文件和程序，并按大小排序。令B_s为输出s的这些二进制文件的子列表（当然B_s是不可计算的）。

由于每组正整数都必须有一个最小值，因此 B_s 中必定存在一个最小的程序 b_min_s。

对于哪些语言（即字符串集），我们知道 b_min_s 的大小？也许只是一个估计。（我可以构造一些简单的例子，我什至可以计算 B_s 和 b_min_s，但我对更有趣的语言感兴趣。）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

鸠书 2024-09-16 08:35:36

这是Kolmogorov 复杂度，你是正确的，它是不可计算。如果是的话，您可以创建一个长度为 n 的矛盾程序，打印一个柯尔莫哥洛夫复杂度为 m > 的字符串。名词

显然，您可以为给定输入绑定b_min_s。然而，据我所知，大多数这样做的努力都是存在的证据。例如，压缩英语维基百科正在进行一场竞赛。

回复收藏 0 原文

花海 2024-09-16 08:35:36

Claude Shannon 估计英语语言的信息密度在每个字符 0.6 到 1.3 位之间他 1951 年的论文印刷英语的预测和熵（PDF，1.6MB。贝尔系统技术杂志（3）第 50-64 页）。

回复收藏 0 原文

一个人的夜不怕黑 2024-09-16 08:35:36

最大（平均）压缩率为 1:1。
可能的输入数量等于输出数量。
它必须能够将输出映射回输入。
为了能够存储输出，您需要与输入的最小容器大小相同的容器 - 提供 1:1 的压缩率。

回复收藏 0 原文

明月夜 2024-09-16 08:35:36

基本上，您需要足够的信息来重建原始信息。我想其他答案对您的理论讨论更有帮助，但请记住这一点。

回复收藏 0 原文

~没有更多了~

关于作者

‘画卷フ

暂无简介

0 文章

0 评论

22 人气

关注发私信

linfzu01

文章 0 评论 0

关注

§对你不离不弃

文章 0 评论 0

关注

可遇━不可求

文章 0 评论 0

关注

枕梦

文章 0 评论 0

关注

qq_3LFa8Q

文章 0 评论 0

关注

JP

文章 0 评论 0

友情链接

文江博客

理论上可能的最大压缩率是多少？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签