请问c++在文件读写时能否强行要求它按照8bit一个字符读入?

发布于 2022-09-11 15:56:47 字数 619 浏览 29 评论 0

情景是这样的
一个霍夫曼编码树的作业,所谓霍夫曼编码就是按照一定方式将文本中的字符用 0 和 1 重新编码,其中出现较多的字符所用的位数少.比如说字母 e 在这个文本中大量出现,可能给它规定的编码就是 01,而字母 s 较少出现,可能给它的编码就是 011110.
因为我没法直接对文件读写 bit(如果有办法或者有成熟的库还劳烦推荐),所以只有先将文件的内容全部转换为 0 或 1 的 字符存储在一个 string 里,然后对这个 string 每 8 个字符一截,因为这 8 个字符都是 01 组成的,把这一段当作二进制数处理,就能得到一个 0-255 间的数,然后把这个数强制类型转换为 char 然后输出到一个文件里去..
然后问题来了,现在我要从这个文件里读我输出的内容(显然直接去看这个内容的话会是一堆乱码)...
我的想法是乱不乱码没关系,反正我读进来放到一个 string 里,然后每个字符对应一个 0-255 的数,我再把这个数转回那个二进制字符串,然后拼起来,这样我就又得到霍夫曼编码了...结果发现这一步已经回不去了...
我个人的想法是可能我在读入的时候,c++一脸懵逼不知道它要按照什么编码方式,在读入啥 j8 玩意儿,所以读回来的东西猜不对..如果能告诉 c++你就按照 8bit 一字符读,具体读进来的内容到底是什么用不着你管,我觉着能解决这个问题吧?
谢谢

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

倾`听者〃 2022-09-18 15:56:47

其实说到底,还是要靠二进制读写文件来解决这个问题.

奈何桥上唱咆哮 2022-09-18 15:56:47

建议你去看一下C++的读取文件方法,其实各种语言读取文件首先是二进制,其次才是转换为其他类型。再者你要搞清楚二进制数组和字符串“0”,“1”的数组有根本区别。你这个区别搞不定,你就不是霍夫曼压缩了,你最后的文件绝对更大。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文