XMLReader -- 遇到 utf 字符问题
我正在解析一个巨大的 xml 文件,并且需要说明文件的编码
<强>< ? xml version="1.0"encoding="ISO-8859-1" ?>**bold
数据库编码是 utf8,我在将任何内容保存到数据库之前运行此查询
$sql='设置名称“utf8”整理“utf8_swedish_ci”';
问题是有时 xml 文件中会出现一些非标准字符,例如
Lycka™:罗马
我知道商标符号来自windows-1252编码。
我正在使用 php。我试过utf8_encode。
这里保存在数据库 中,
这是浏览器中的输出
我想将其转换为utf,就是这样
I am parsing a huge xml file and encoding of file is to be said
< ? xml version="1.0" encoding="ISO-8859-1" ?>**bold
The db encoding is utf8 and I am running this query before anything is saved to db
$sql='SET NAMES "utf8" COLLATE "utf8_swedish_ci"';
What the problem is that sometimes some non standard characters comes in the xml file like
Lycka™ : roman
I know that trademark symbol is from windows-1252 encoding.
Im using php. I have tried utf8_encode.
here is saved in db and
here is the output in browser
I want it to converted to utf, that's it
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您是否尝试在保存到 db 之前将字符串编码为 utf8 ?
对于 php 有 utf8_encode() 函数,您使用的语言中可能有类似的函数。
Did you try encoding the string in utf8 before saving to db ?
For php there is utf8_encode() function, there might be similar functions in the language you are using.
我使用了这段代码并且工作得很好
I used this code and worked fine