当前位置：文江博客话题详情

如何在 C++ 中使用 libiconv 将 ISO-8859-1 转换为 UTF-8

发布于 2024-09-28 16:38:02 字数 394 浏览 6 评论 0原文

我正在使用 libcurl 来获取一些 HTML 页面。

HTML 页面包含一些字符引用，例如： סלקום

当我使用 libxml2 阅读此内容时，我得到：

是 ISO-8859-1 编码吗？

如果是这样，我如何将其转换为 UTF-8 以获得正确的单词。

谢谢

编辑：我得到了解决方案，MSalters 是对的，libxml2 确实使用 UTF-8。

我将其添加到 eclipse.ini

-Dfile.encoding=utf-8

中，最后我在 Eclipse 控制台上看到了希伯来语字符。谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

沩ん囻菔务 2024-10-05 16:38:02

您看过 i18n 上的 libxml2 页面吗？它解释了 libxml2 如何解决这些问题。

您将会从libxml2得到一个ס。但是，您说您得到了类似 ׳₪׳ě׳�׳ ׳ě 的内容。你为什么认为你得到了那个？您将获得一个 XMLchar*。你是如何将该指针转换为上面的字符串的？您可能使用过调试器吗？该调试器是否知道如何呈现 XMLchar* ？我敢打赌 XMLchar* 是正确的，但您使用的调试器无法在 XMLchar* 中呈现 Unicode

要回答您的最后一个问题，XMLchar* 已经是UTF-8，不需要进一步转换。

回复收藏 0 原文

变身佩奇 2024-10-05 16:38:02

不会。这些实体对应于字符的 Unicode 序列号的十进制值。例如，请参阅此页面。

因此，您可以将 Unicode 值存储为 integers，并使用算法将这些整数转换为 UTF-8 多字节字符。请参阅 UTF-8 规范。

回复收藏 0 原文

孤单情人 2024-10-05 16:38:02

这个答案是在假设编码文本以 UTF-16 形式返回的情况下给出的，但事实证明并非如此。

我猜测编码是 UTF-16 或 UCS2。将此指定为 iconv 的输入。也可能存在字节序问题，请查看 here

c 风格的方式是（不检查清晰度）：

iconv_t ic = iconv_open("UCS-2", "UTF-8");
iconv(ic, myUCS2_Text, inputSize, myUTF8-Text, outputSize);
iconv_close(ic);

This answer was given in the assumpltion that the encoded text is returned as UTF-16, which as it turns out, isn't the case.

I would guess the encoding is UTF-16 or UCS2. Specify this as input for iconv. There might also be an endian issue, have a look here

The c-style way would be (no checking for clarity):

iconv_t ic = iconv_open("UCS-2", "UTF-8");
iconv(ic, myUCS2_Text, inputSize, myUTF8-Text, outputSize);
iconv_close(ic);

回复收藏 0 原文

~没有更多了~

关于作者

转身泪倾城

暂无简介

0 文章

0 评论

25 人气

关注发私信

友情链接

文江博客

如何在 C++ 中使用 libiconv 将 ISO-8859-1 转换为 UTF-8

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

如何在 C++ 中使用 libiconv 将 ISO-8859-1 转换为 UTF-8

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。