当前位置：文江博客话题详情

霍夫曼算法汇编

发布于 2024-12-20 08:37:46 字数 314 浏览 2 评论 0原文

我需要编写一个程序来使用

我编写的霍夫曼算法来压缩/解压缩txt文件，它对于字符数少于缓冲区大小的文件很有用，但对于字符数较多的文件则不起作用。

我的问题是将压缩缓冲区与解压缩缓冲区连接起来。

因此，如果压缩写入的字节数（包含要遍历树的 1 和 0）与解压缩读取的字节数不同，则它不起作用。例如，如果压缩缓冲区写入200，我需要解压缩缓冲区正好读取200字节。

如果我将解压缩的大小设置为读取 200，则压缩会在某个地方写入 200，其他时候会写入小于或大于 200。

您能否建议如何跟踪每次压缩写入的字节数并将其传输到解压缩部分？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

南城追梦 2024-12-27 08:37:46

“跟踪”流末尾的常见方法是专门为此用途添加 N+1“EOF”符号。这样，您就不需要维护任何“大小”计数器。

回复收藏 0 原文

在梵高的星空下 2024-12-27 08:37:46

我没有使用任何缓冲区。在我的文件的标题中，我写下了代码长度和代码本身。因此，当我想解压缩文件时，首先我从标头中读取代码长度和代码（您也可以在标头中放入几个字节来检查文件的正确性：例如 XXY，因此如果文件不是以这些字节开头，则它已损坏）。在读取代码长度和代码后，是时候解码其余数据了。您可以通过以下方式对其进行解码：

int data=0,dataLength=0;
while (input.read((char*)&sign, sizeof sign)) {     
    data = (data << 8) + sign;
    dataLength += 8;
    for (int i=0; i<256; i++) {
        if (dataLengthFromHeader[i]==0)
            continue;
        if (dataLength>=dataLengthFromHeader[i] && codesFromHeader[i] == data >> (dataLength-dataLengthFromHeader[i])) {
            unsigned char code = i;
            izlaz.write((char*)&code, sizeof code);
            dataLength -= dataLengthFromHeader[i];
            data = data - (codesFromHeader[i] << dataLength);
            if (dataLength==0) break;
                i=0;
        }
    }
}

I did't use any buffers. In header of my file I write down code length, and code itself. So when I want to decompress my file, first I read code lengths and codes from my header (you can also put few bytes in header to check correctness of file: for example XXY, so if file does not start with these bytes, its corrupted). After I read my code lengths, and my codes, it is time to decode rest of data. You can decode it in this way:

int data=0,dataLength=0;
while (input.read((char*)&sign, sizeof sign)) {     
    data = (data << 8) + sign;
    dataLength += 8;
    for (int i=0; i<256; i++) {
        if (dataLengthFromHeader[i]==0)
            continue;
        if (dataLength>=dataLengthFromHeader[i] && codesFromHeader[i] == data >> (dataLength-dataLengthFromHeader[i])) {
            unsigned char code = i;
            izlaz.write((char*)&code, sizeof code);
            dataLength -= dataLengthFromHeader[i];
            data = data - (codesFromHeader[i] << dataLength);
            if (dataLength==0) break;
                i=0;
        }
    }
}

回复收藏 0 原文

~没有更多了~