无论编码如何，从 Wifstream 中提取正确的文本

发布于 2024-08-21 15:30:47 字数 494 浏览 5 评论 0原文

程序如下：http://codepad.org/eyxunHot
文件的编码是UTF -8。

我有一个名为“config.ini”的文本文件，其中包含以下单词： ➑ball

如果我使用记事本以“UTF-8”编码保存文件，然后运行程序，根据调试器，八球的值为：如果我用记事本

以“Unicode”编码保存文件，然后运行程序，根据调试器，八球的值为： ÿþ'b

如果我使用记事本以“Unicode big endian”编码保存文件，然后运行程序，根据调试器，八球的值为： þÿ'

在所有这些情况下，结果都是不正确的。另外 ANSI 编码不支持 ➑ 符号。当我进入 config_file >> 时，如何确保单词 ➑ball 将从文件中提取出来？八球，无论编码如何？我希望该程序的输出是“程序正确”，无论 config.ini 的编码如何。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

猥︴琐丶欲为 2024-08-28 15:30:47

如果您在 Windows 下并且想要使用 INI 文件，请记住，INI API 支持 Unicode（UTF-16 小端）INI 文件，没有任何问题，您只需在开头提供带有 BOM 的空文件即可。

顺便说一句，如果您想使用 C++ 流和 Unicode，您可能需要查看这篇文章。除了 UTF8 之外，您还将了解 C++ 流中字符转换的原理。

回复收藏 0 原文

恏ㄋ傷疤忘ㄋ疼 2024-08-28 15:30:47

也许你可以使用 ICU 库。

Windows 在 UTF 支持方面存在许多问题。我的 Ubuntu 使用默认的 UTF-8 编码，这个问题已经解决，但是类 Unix 操作系统有一些奇怪的 C++ 标准库实现。我的意思是使用 char* 来保存 UTF-8 文本（它在字母上使用 2 个数组单元格）。但使用字符串类它会清理。

回复收藏 0 原文

絕版丫頭 2024-08-28 15:30:47

您需要先设置区域设置，wstreams 才能正常工作。相反，我建议使用常规流和一些库进行字符转换，因为您的输入编码通常会有所不同。目前最好的算法是首先尝试读取为 UTF-8，如果失败，请尝试读取为 CP1252 或其他一些用户可配置的旧字符集。

回复收藏 0 原文

~没有更多了~

关于作者

洒一地阳光

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

无论编码如何，从 Wifstream 中提取正确的文本

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

金兰素衣

ゃ人海孤独症

没有感情的刽子手

一枫情书

清晰传感

mb_XvqQsWhl

友情链接

无论编码如何，从 Wifstream 中提取正确的文本

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

金兰素衣

ゃ人海孤独症

没有感情的刽子手

一枫情书

清晰传感

mb_XvqQsWhl

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。