如何将 ISO 8859-1 字符转换为 UTF-8

发布于 2024-12-17 22:15:29 字数 501 浏览 2 评论 0原文

我使用 CURL 从另一个站点获取内容，但我不知道为什么它会自动从 UTF-8 转换为 ISO 8859-1，如下所示：

site: abc.com:

Cửa Hàng Chip Chip: Rộn ràng đón Giáng sinh với những vật phẩm trang trí Noel đầy màu sắc của CHIPCHIP GIFT SHOP

但是当我使用 CURL 从该网站获取内容时，我得到了以下信息：

Cửa Hàng Chip Chip: Rộn r&agrave;ng đ&oacute;n Gi&aacute;ng sinh với những vật phẩm trang tr&iacute; Noel đầy m&agrave;u sắc của CHIPCHIP GIFT SHOP

那么如何将其转换为 UTF-8 ？

原文

I use CURL to get content from another site, but i don't know why it's auto convert from UTF-8 to ISO 8859-1, like follow:

site: abc.com:

Cửa Hàng Chip Chip: Rộn ràng đón Giáng sinh với những vật phẩm trang trí Noel đầy màu sắc của CHIPCHIP GIFT SHOP

But when i use CURL get content from that site, i got follow:

Cửa Hàng Chip Chip: Rộn ràng đón Giáng sinh với những vật phẩm trang trí Noel đầy màu sắc của CHIPCHIP GIFT SHOP

So how to convert it's become to UTF-8 ?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

樱娆 2024-12-24 22:15:29

我建议使用 iconv。

iconv --list 为您提供所有已知编码的列表，然后您可以使用 iconv -f FROM_ENCODING -t TO_ENCODING 进行转换。它还可以从标准输入读取，因此可以插入curl。

但是关于您对问题的评论：似乎文件作者并不关心使用正确的编码，而是决定坚持使用（旧式？） ä 之类的东西。

回复收藏 0 原文

对你的占有欲 2024-12-24 22:15:29

将字符串放入变量中并使用以下函数。

$var = "";
echo utf8_encode($var);

Take your string in variable and use following function.

$var = "";
echo utf8_encode($var);

回复收藏 0 原文

惜醉颜 2024-12-24 22:15:29

从您粘贴的行来看，问题似乎出在 HTML 实体上，而不是字符编码上。编码的字符对我来说看起来很好。

您需要将这些 HTML 实体转换为编码字符。使用哪种工具取决于您的环境或编程语言。我认为仅用 CURL 是无法完成的。

PHP 有 htmlspecialchars_decode()。来自 HTMLParser 模块的 Python unescape() 。

回复收藏 0 原文

微凉 2024-12-24 22:15:29

curl 不会转换任何内容，“按原样”下载内容。

您看到的是字符实体、有效的 html 以及转换为可读形式的浏览器。

您可以通过在浏览器中打开curl 保存的文件来检查这一点。它看起来像实时页面。

回复收藏 0 原文

梦罢 2024-12-24 22:15:29

您可以尝试以下操作：

html_entity_decode($string)

在此处查看更多内容： html_entity_decode

You can try this:

html_entity_decode($string)

See more here: html_entity_decode

回复收藏 0 原文

如果没有 2024-12-24 22:15:29

您的文件不会转换为其他编码。他们使用 HTML 字符实体。您需要转换这些实体，例如 é 转换为 UTF-8，例如 é。转换为 UTF-8 后，如果您确实需要这样做，则需要额外一行代码。

回复收藏 0 原文

~没有更多了~

关于作者

陌上青苔

暂无简介

文章

27 人气

关注发私信

李珊平

文章 0 评论 0

关注

Quxin

文章 0 评论 0

关注

范无咎

文章 0 评论 0

关注

github_ZOJ2N8YxBm

文章 0 评论 0

关注

若言

文章 0 评论 0

关注

南…巷孤猫

文章 0 评论 0

友情链接

文江博客

如何将 ISO 8859-1 字符转换为 UTF-8

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（6）

关于作者

相关话题

热门标签

推荐作者

李珊平

Quxin

范无咎

github_ZOJ2N8YxBm

若言

南…巷孤猫

友情链接

如何将 ISO 8859-1 字符转换为 UTF-8

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（6）

关于作者

相关话题

热门标签

推荐作者

李珊平

Quxin

范无咎

github_ZOJ2N8YxBm

若言

南…巷孤猫

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。