当前位置：文江博客话题详情

C 中的二进制数组压缩

发布于 2024-09-15 10:52:57 字数 90 浏览 4 评论 0原文

我在c中有二进制数组，我想压缩该数组，请建议我压缩二进制数组的算法。我使用过 Lempel-Ziv-Welch (LZW) 算法，但它不适合我，因为我的数据没有重复。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

长发绾君心 2024-09-22 10:52:57

为什么不直接使用 libz 的放气？作为额外的好处，libz 几乎可以在所有现有平台上使用。

或者更新的 LZMA？它在二进制数据压缩方面击败了 bzip2。

回复收藏 0 原文

山人契 2024-09-22 10:52:57

您可能没有重复，但数据中仍然可能存在可以利用的模式。不过，这需要更多地了解数据，而不是不存在重复。

如果您的数据实际上（或几乎）随机分布，那么压缩它将会遇到洋泾浜漏洞问题。这说明如果你只有 X 个洋泾浜语言和 Y 个可放入它们的孔，并且 X > 。是的，那你的空间不够了。在压缩中，这意味着您无法利用不存储某些洋泾浜语的能力，这些洋泾浜语与已经在洞中的洋泾浜语是同卵双胞胎，而只需在解压缩算法中留下注释来克隆该洋泾浜语。在霍夫曼编码中，所有洋泾浜语言都是洋泾浜语言库中洋泾浜语言的克隆。在其他几个压缩方案中，一些洋泾浜语可能是由其他洋泾浜语组成的大型洋泾浜语。

回复收藏 0 原文

苍风燃霜 2024-09-22 10:52:57

您可以轻松地将空间减半！

由于您的二进制数据没有重复，因此您唯一的选项是 [0, 1], [1, 0]。任何更多的内容都会重复零或一。因此，你可以用 0 表示第一个集合，用 1 表示第二个集合。编码看起来像这样...

encode [0, 1] = 0
encode [1, 0] = 1

而解码将是...

decode 0 = [0, 1]
decode 1 = [1, 0]

对 haskell 语法感到抱歉，它在这个中更具可读性案件。这会将您的二元数组变成一元数组，并且可以存储在一半的空间中！魔法。

编辑：这忽略了 [0] 和 [1] 的小情况。如果需要处理这些（尽管您不应该真正压缩 1 位），则不可能获得比 100% 更好的压缩率。

You can cut the space in half easily!

Since your binary data has NO repetition, your only options are [0, 1], [1, 0]. Anything more would repeat either a zero or a one. Therefore, you can just represent the first set with a 0 and the second set with a 1. Encoding would look something like this...

encode [0, 1] = 0
encode [1, 0] = 1

And decoding would be...

decode 0 = [0, 1]
decode 1 = [1, 0]

Sorry for the haskell syntax, it's just so much more readable in this case. This turns your two element array into a one element array, and can be stored in half the space! Magic.

EDIT: This ignores the trivial case of [0] and [1]. If those need to be handled (although you shouldn't really be compressing 1 bit), it is impossible to get a better compression ratio than 100%.

回复收藏 0 原文