将latin1字符串转换为utf8?
如何将包含 latin1 字符的字符串转换为 utf8?
该字符串是一个文档,由 open-uri 打开并包含这些特殊字符。
此致
how can I convert a string, that contains latin1 characters to utf8?
The string is a document, that is opened by open-uri and that contains these special characters.
Best regards
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
发布评论
评论(2)
看透却不说透2024-08-14 20:41:02
从你的标签来看,我猜你想要这样的东西:
require 'rubygems'
require 'open-uri'
require 'nokogiri'
require 'iconv'
file = open(your_uri)
doc = Nokogiri::HTML(Iconv.conv('utf-8', 'latin1', file.readlines.join("\n")))
doc.xpath(your_xpath)
如果你不确定 uri 使用什么字符集,你可以使用 file.charset
来获取字符集而不是 'latin'
。
~没有更多了~
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
Iconv
Iconv