XML 文件中的特殊 HTML 字符 ( & # 39; -> quot )
我的 XML 文件中有一个“'”。 (它是 HTML 中 quot 的字符代码)
EX :
<描述> blabla bla & #39;巴拉巴拉。 < / 描述>
当我用 String tmp = itemOfEvent.getFirstChild().getNodeValue() 解析它时,它会在 quot 之前剪切我的文本。
我的 URL.encode(tmp, "UTF-8")
崩溃了 有
更好的主意吗?
I got an " & # 39; " in my XML file. (it is the char code for the quot in HTML)
EX :
< desc > blabla bla & # 39; bla bla la. < / desc>
When i parse it with String tmp = itemOfEvent.getFirstChild().getNodeValue()
it cut my text juste before the quot.
I got a crash with URL.encode(tmp, "UTF-8")
Better idea ?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
你说文本是 HTML 编码的,所以试试这个:
You say that the text is HTML encoded so try this:
我发现的最好的解决方案是替换坏字符
The best solution i've found was to replace bad char
我假设您正在使用 SAXParser 解析 XML 文件?在这种情况下,请注意,在解析单个元素时可以多次调用“characters()”方法(就像您的情况一样)。试试这个:
I assume you're parsing the XML file with a SAXParser? In this case, note that the 'characters()'-method can be called multiple times while parsing a single Element (as it does in your case). Try this: