PHP 的 cUrl 函数返回错误字符

发布于 2024-10-25 19:02:56 字数 177 浏览 1 评论 0原文

我正在尝试使用 cURL 检索远程 HTML 页面 - 但是,当我分析返回的文本时,我注意到很多奇怪的字符,例如 [–€€,这使得我认为文本编码中的某个地方出了问题。

如何确保从 cURL 返回的文本经过正确编码,以及如何对其进行规范化,以便可以安全地将结果存储在数据库中而不会出现任何编码问题?

I'm attempting to retrieve a remote HTML page with cURL - however, when I analyze the text that gets returned, I'm noticing alot of odd characters like ▀Ã, which makes me think that something went wrong with the text encoding somewhere along the line.

How can I ensure that the text I get back from cURL is properly encoded, and how can I normalize it so I can safely store results in a database without any encoding issues?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

安穩 2024-11-01 19:02:56

我希望您已将 CURLOPT_ENCODING 设置为“”,并且页面中没有充满您看到的那些乱码,我建议的第二件事是通过诸如 html 实体之类的东西运行字符串来清理它。 Curl 只是获取/发布数据,恕我直言,不会更改编码

I hope you have set CURLOPT_ENCODING to "" and the page is not full of those gibberish which you see, second thing I can suggest is to run the string through some thing like html entities to sanitise it. Curl simply gets/posts the data and, IMHO, doesn't change the encodings

往昔成烟 2024-11-01 19:02:56

您需要在页面顶部包含以下内容:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

You need to include the following on the top of your page:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文