是否有更有效的压缩算法来压缩64base编码的字符串？

发布于 2025-02-05 19:08:32 字数 606 浏览 3 评论 0原文

假设我有一个5个字符字符串，并且字符可以是64个字符之一[A-ZA-Z0-9+/]。我想生成所有可能的字符串（64^5个字符串），并将这些字符串存储在DB中，并最大程度地减少将它们存储在DB中所需的空间。

我对压缩算法了解不多，但是我认为我只能将每个字符编码为6位代码，并用base64编码并将每个代码连续存储在4个字节块中。我只浪费2位存储每个字符串。

当我查找压缩算法时，我会看到类似Huffman代码的内容，这些代码应该非常有效。例如，我看了看这篇文章关于“ bcaadddccacacac”字符串编码的Huffman编码。字符串长15个字符，每个字符都是一个字节存储，因此存储为15个字节。通过霍夫曼编码，它们的尺寸将大小降低到75位，即10个字节。但是，只需进行基本2编码，您不能做得更好吗？只有4个字符，因此您可以存储15个2位代码的连续流，该流只需要30位= 4个字节。

我只是不确定我在这里是否缺少东西。

原文

分享到QQ

分享到微博