压缩后将哈夫曼树写入文件

发布于 2024-12-23 12:02:55 字数 309 浏览 1 评论 0原文

在插入所有实际的压缩文件数据后，我试图将霍夫曼树写入压缩文件。但是，我刚刚意识到一个问题，假设我决定一旦所有实际数据都写入文件，我将放入 2 个换行字符，然后写入树。这意味着，当我读回内容时，这两个换行符（或实际上的任何字符）是我的分隔符。问题是，实际数据完全有可能也有两个相继的换行符，在这种情况下，我的分隔符检查将失败。我在这里举了两个换行的例子，但对于任何字符串都是如此，我可以通过采用更长的字符串作为分隔符来颠覆问题，但这会产生两个不良影响： 1. 压缩数据中出现长字符串的可能性仍然很小。 2. 不必要地膨胀需要压缩的文件。

有人对如何将压缩数据与树数据分离有任何建议吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

寒江雪… 2024-12-30 12:02:55

首先，以字节为单位写入树的大小。然后，编写树本身，然后编写内容本身。

读取时，首先读取大小，然后读取树（现在您知道要读取多少个字符），然后读取内容。

大小可以写为字符串，以换行符结尾 - 这样，您就知道第一个数字和换行符属于树的大小。

回复收藏 0 原文

独﹏钓一江月 2024-12-30 12:02:55

为什么不在前 8 个字节（各 4 个）上写入大小和长度，然后再写入数据？
然后是这样的：

uint32_t compressed_size;
uint32_t data_len;
char * data;

file.read((char*)compressed_size, 4);
file.read((char*)data_len, 4);
data = new char[data_len];
zip.read(data, data_len);

应该有效。
您可以缩小数据以获得更好的压缩效果。

Why not write the size and len on the first 8 bytes (4 each) and then the data?
Then something like:

uint32_t compressed_size;
uint32_t data_len;
char * data;

file.read((char*)compressed_size, 4);
file.read((char*)data_len, 4);
data = new char[data_len];
zip.read(data, data_len);

Should work.
You could deflate the data for better compression.

回复收藏 0 原文

~没有更多了~