中文乱码,所有编码格式都试过了,还是不行

发布于 2022-09-06 03:13:13 字数 287 浏览 28 评论 0

我有一个从某一BI系统导出的csv格式的文件,英文数字正常显示,但中文都是乱码,用Word和Notepad++打开,把所有字符集都试过了,都不能正常显示,应该如何解决?

通过和网页上的报表对比,得知:
货号 显示为 »õºÅ 16进制:c2bb c3b5 c2ba c385
品名 显示为 Æ·Ãû 16进制:c386 c2b7 c383 c3bb

我知道怎么回事了,原始数据是GBK编码的,然后程序内使用了一个Windows1252转UTF-8的函数去转,于是就毁了……所以这边想问一下应该怎么转回来?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

鹤舞 2022-09-13 03:13:13

你使用的是什么变成语言,提供一个java的解决方案
首先把字符串读取出来,然后getbyte使用Windows1252,再new string的时候设置编码,然后再输出出来。。。

    public static void main(String... args) throws UnsupportedEncodingException {
        String a = "»õºÅ ";
        String b = new String(a.getBytes("windows-1252"),"gbk");
        System.out.println(b);
    }

蛮蛋疼的。。。
介绍一个编码错误时推测的网站乱码恢复

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文