当前位置：文江博客话题详情

C# 中的字符串编码 - 奇怪的字符

发布于 2024-12-09 11:48:07 字数 370 浏览 0 评论 0原文

我有一个需要导入的文件。问题是我对该文件中的很多字符都有问题。

例如，这些名称是错误的：

Björn （在文件中） - 应该是 Björn

á…ke （在文件中） - 应该是 < 不幸的

是，我无法使用正确的编码重新创建该文件。还有很多字符是错误的（这些只是例子）。我无法对所有内容进行搜索和替换（如果没有包含所有转换的字典）。

我可以以某种方式解码字符串吗？

谢谢帕特里克

编辑： 只是我之前应该添加一些更多信息（我责怪我的疲劳）。该文件是 .xlsx 文件。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

吾性傲以野 2024-12-16 11:48:07

我用 Notepad++ 调试了这个。我将正确的字符串复制到 Notepad++ 中。我使用编码 |转换为 UTF-8。然后我选择编码|编码为 ANSI。这具有将 UTF-8 字节解释为 ANSI 字节的效果。当我这样做时，我最终得到了和你一样的错误价值观。很明显，当您阅读您正在解释的文件时，它是 ANSI 而不是 UTF-8。

解决方案是您的文件已编码为 UTF-8。确保在读取该文件时将其解释为 UTF-8。我无法确切地告诉你如何做到这一点，因为你没有展示你是如何阅读文件的。

您的文件可能不包含字节顺序标记 (BOM)。如果是这样，则在读取文件时通过传递来指定编码编码.UTF8。

回复收藏 0 原文