请问c++在文件读写时能否强行要求它按照8bit一个字符读入?
情景是这样的
一个霍夫曼编码树的作业,所谓霍夫曼编码就是按照一定方式将文本中的字符用 0 和 1 重新编码,其中出现较多的字符所用的位数少.比如说字母 e 在这个文本中大量出现,可能给它规定的编码就是 01,而字母 s 较少出现,可能给它的编码就是 011110.
因为我没法直接对文件读写 bit(如果有办法或者有成熟的库还劳烦推荐),所以只有先将文件的内容全部转换为 0 或 1 的 字符存储在一个 string 里,然后对这个 string 每 8 个字符一截,因为这 8 个字符都是 01 组成的,把这一段当作二进制数处理,就能得到一个 0-255 间的数,然后把这个数强制类型转换为 char 然后输出到一个文件里去..
然后问题来了,现在我要从这个文件里读我输出的内容(显然直接去看这个内容的话会是一堆乱码)...
我的想法是乱不乱码没关系,反正我读进来放到一个 string 里,然后每个字符对应一个 0-255 的数,我再把这个数转回那个二进制字符串,然后拼起来,这样我就又得到霍夫曼编码了...结果发现这一步已经回不去了...
我个人的想法是可能我在读入的时候,c++一脸懵逼不知道它要按照什么编码方式,在读入啥 j8 玩意儿,所以读回来的东西猜不对..如果能告诉 c++你就按照 8bit 一字符读,具体读进来的内容到底是什么用不着你管,我觉着能解决这个问题吧?
谢谢
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
其实说到底,还是要靠二进制读写文件来解决这个问题.
建议你去看一下C++的读取文件方法,其实各种语言读取文件首先是二进制,其次才是转换为其他类型。再者你要搞清楚二进制数组和字符串“0”,“1”的数组有根本区别。你这个区别搞不定,你就不是霍夫曼压缩了,你最后的文件绝对更大。