将二进制数据转换为字符串

发布于 2025-01-02 11:41:15 字数 431 浏览 0 评论 0原文

如果我有一些二进制数据 D 并且将其转换为字符串 S。我希望将其转换回二进制数据我会得到 D。但这是错误的。

public class A {
    public static void main(String[] args) throws IOException {
        final byte[] bytes = new byte[]{-114, 104, -35};// In hex: 8E 68 DD
        System.out.println(bytes.length);               //prints 3
        System.out.println(new String(bytes, "UTF-8").getBytes("UTF-8").length); //prints 7
    }
}

为什么会出现这种情况？

原文

If I have some binary data D And I convert it to string S. I expect than on converting it back to binary I will get D. But It's wrong.

public class A {
    public static void main(String[] args) throws IOException {
        final byte[] bytes = new byte[]{-114, 104, -35};// In hex: 8E 68 DD
        System.out.println(bytes.length);               //prints 3
        System.out.println(new String(bytes, "UTF-8").getBytes("UTF-8").length); //prints 7
    }
}

Why does this happens?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

葬﹪忆之殇 2025-01-09 11:41:15

在字节数组和字符串之间进行转换并不是一对一的映射操作。阅读 docs，字符串实现使用 CharsetDecoder 将传入的字节数组转换为 unicode。输入字节数组中的第一个和最后一个字节不得映射到有效的 unicode 字符，因此它将替换为一些替换字符串。

回复收藏 0 原文

作死小能手 2025-01-09 11:41:15

您转换为字符串的字节实际上可能不会形成有效的字符串。如果 java 无法弄清楚每个字节的含义，它会尝试修复它们。这意味着当您转换回字节数组时，它不会与开始时相同。如果您尝试使用一组有效的字节，那么您应该会更成功。

回复收藏 0 原文

謌踐踏愛綪 2025-01-09 11:41:15

您的数据无法使用 UTF-8 编码解码为有效的 Unicode 字符。查看解码后的字符串。它由 3 个字符组成：0xFFFD、0x0068 和 0xFFFD。第一个和最后一个是“�” - Unicode 替换字符。我认为你需要选择其他编码。即“CP866”产生有效的字符串并转换回相同的数组。