当前位置：文江博客话题详情

ISO latin 1 字节转字符

发布于 2024-10-10 10:53:32 字数 125 浏览 2 评论 0原文

如果我有一个 byte b 编码为 ISO Latin 1 (ISO 8859-1) 就足够了 char output = (char)b; 这似乎可行，但我不知道是否还有其他方法。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

许你一世情深 2024-10-17 10:53:32

直接转换似乎适用于这种特定的编码。但是，最佳实践是使用 Encoding.GetChars 方法来获得正确的转换。

private static readonly Encoding Iso88591 = Encoding.GetEncoding("ISO8859-1");

public static void Main() {
    var bytes = new Byte[] { 65 };
    var chars = Iso88591.GetChars(bytes);
}

A direct cast seems to work for this particular encoding. However, best practice would be to use the Encoding.GetChars method for proper conversion.

private static readonly Encoding Iso88591 = Encoding.GetEncoding("ISO8859-1");

public static void Main() {
    var bytes = new Byte[] { 65 };
    var chars = Iso88591.GetChars(bytes);
}

回复收藏 0 原文

金兰素衣 2024-10-17 10:53:32

是的，这应该可以正常工作。如果您查看 8859-1 的 unicode 图表，就会发现一个8859-1 和 unicode 之间的一对一映射。这意味着您可以将其强制转换为 char。

然而，并非所有代码页都是如此，因此更强大的解决方案可能是一个好主意。

回复收藏 0 原文

飘过的浮云 2024-10-17 10:53:32

您可以使用编码 类 - 特别是内置的 编码。 ASCII 从字节数组中获取字符。

特别是 GetChars 重载之一。

回复收藏 0 原文

转瞬即逝 2024-10-17 10:53:32

我会使用 BitConverter 的 ToChar。请记住，首先，.NET 中的 char 默认情况下是一个 2 字节值 - 像这样的简单转换（即使它有效，也可能有效）并不是最好的主意。

回复收藏 0 原文

毅然前行 2024-10-17 10:53:32

如果字节的值< 128，你很好。如果它 >=128，仅进行转换可能无法获得正确的角色。

ISO 代码页基本上都是 ASCII，主要区别在于将代码页值的上半部分（基本 ASCII 页面上的 IIRC 主要是在控制台应用程序中有用的线条艺术字符）替换为对代码页语言有用的字符。

然而，快速浏览一下 Unicode 代码页就会发现，Latin-1 补充占据了 80-FF 值 (128-255)。因此，在这个特定的实例中，您可能没问题，但如果出现了某些内容，例如西里尔字母 ISO 代码页，您将必须显式转换为 Unicode 字符。

回复收藏 0 原文

小嗲 2024-10-17 10:53:32

您可以使用Encoding.Convert。

        byte[] latin1 = new byte[]{}; // Your data goes here, obviously
        byte[] converted = Encoding.Convert(Encoding.GetEncoding("latin1"), Encoding.ASCII, latin1);

然后，您可以使用新的字节数组，而不必担心 Latin 1 是否会给您带来问题。

You can use Encoding.Convert.

        byte[] latin1 = new byte[]{}; // Your data goes here, obviously
        byte[] converted = Encoding.Convert(Encoding.GetEncoding("latin1"), Encoding.ASCII, latin1);

You can then work with the new byte array without worrying about whether Latin 1 will cause you problems.

回复收藏 0 原文

~没有更多了~