String byte[]中相互转化的字符集乱码问题

发布于 2022-09-01 18:34:18 字数 561 浏览 51 评论 0

clipboard.png

 private static FileInputStream fr;
 fr = new FileInputStream("E://test-1.txt");
byte[] initContent = new byte[1024];
int size =  fr.read(initContent);
byte[] content = Arrays.copyOf(initContent, size);
String srcString = new String(initContent,"utf-8");
System.out.println("Original string:" + srcString);
输出为
Original string:Wish you success��

Why there are two �?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

吃素的狼 2022-09-08 18:34:18

试验了一下,叹号是全角的的时候,.txt 文件按 GBK 编码保存。
这种情况下读出来按 UTF8 生成字符串就是两个问号。
你改成 GBK 应该就对了。

如果你的文本文件用 UTF8 保存,然后读出来按 GBK 生成字符串,一样会乱码,你可以试试。

还有这里

String srcString = new String(initContent, "utf-8");

你是想写这个吧……

String srcString = new String(content, "utf-8");

要不然 content 完全没用。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文