当前位置：文江博客话题详情

C# encoding character-encoding inputstream streamreader

StreamReader 问题 - 未知文件编码（西方 ISO 88591）

发布于 2024-07-10 14:09:59 字数 449 浏览 11 评论 0原文

从输入文件读取数据时，我注意到 StreamReader 没有读取 ¥ 符号。 Mozilla Firefox 显示输入文件类型为 Western (ISO-8859-1)。

在尝试了编码参数后，我发现它成功地适用于以下值：

System.Text.Encoding.GetEncoding(1252) // (western iso 88591)

System.Text.Encoding.Default 

System.Text.Encoding.UTF7

现在我计划使用“默认”设置，但是我不太确定这是否是正确的决定。现有代码没有使用任何编码，我担心我可能会破坏某些东西。

我对编码知之甚少（或者说一无所知）。我该怎么办？我使用 System.Text.Encoding.Default 的决定安全吗？我应该要求用户以特定格式保存文件吗？

When reading data from the Input file I noticed that the ¥ symbom was not being read by the StreamReader. Mozilla Firefox showed the input file type as Western (ISO-8859-1).

After playing around with the encoding parameters I found it worked successfully for the following values:

System.Text.Encoding.GetEncoding(1252) // (western iso 88591)

System.Text.Encoding.Default 

System.Text.Encoding.UTF7

Now I am planning on using the "Default" setting, however I am not very sure if this is the right decision. The existing code did not use any encoding and I am worried I might break something.

I know very little (OR rather nothing) about encoding. How do I go about this? Is my decision to use System.Text.Encoding.Default safe? Should I be asking the user to save the files in a particular format ?

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

七色彩虹 2024-07-17 14:09:59

代码页 1252 与 ISO-Latin-1 不太一样。如果您需要 ISO-Latin-1，请使用 Encoding.GetEncoding(28591)。但是，我希望它们对于此代码点 (U+00A5) 是相同的。 UTF-7 完全不同（而且几乎不是您想要使用的）。

Encoding.Default 是不安全的 - 在大多数情况下这是一个非常糟糕的主意。它特定于您正在运行的特定计算机。如果您将文件从一台计算机传输到另一台计算机，谁知道原始计算机使用的编码是什么？

如果您知道您的文件采用 ISO-8859-1，则明确使用它。是什么产生了这些文件？如果它们只是由用户保存，那么它们保存在哪个程序中？如果 UTF-8 是一种选择，那么这是一个很好的选择 - 部分原因是它可以处理整个 Unicode。

我有一篇关于 Unicode 的文章和另一篇关于调试 Unicode 问题，您可能会发现它很有用。

回复收藏 0 原文

擦肩而过的背影 2024-07-17 14:09:59

现有代码未使用任何编码

它可能没有明确指定编码，在这种情况下编码可能默认为Encoding.UTF8。

Encoding.Default 名称可能给人的印象是这是 StreamReader 等类使用的默认编码，但事实并非如此：正如 Jon Skeet 指出的，Encoding.Default 是操作系统当前 ANSI 代码页的编码。

我个人认为这使得属性名称 Encoding.Default 有些误导。

回复收藏 0 原文

丢了幸福的猪 2024-07-17 14:09:59

您是软件开发人员吗？不要忘记阅读乔尔·斯波尔斯基（Joel Spolsky）的
每个软件开发人员绝对必须了解 Unicode 和字符集（没有任何借口）！）

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

23 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

尘世孤行

文章 0 评论 0

烟─花易冷

文章 0 评论 0

你是年少的欢喜

文章 0 评论 0

倒带

文章 0 评论 0

忱杏

文章 0 评论 0

送君千里

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文