当前位置：文江博客话题详情

一个特别特别棘手xml sax 解析问题

发布于 2021-11-15 06:17:34 字数 2098 浏览 723 评论 2

我在解析一个远程流过来的 xml进行解析，因为jdom sax他占用内存比较少，所以就选了他。

问题：解析的xml中有中文的时候，他不是一次读取一行内容进行返回的，而是一次一个汉字进行返回的，我就郁闷了，大神帮忙看下。非常感谢！

补充下:xml 文件保存在本地，然后使用FIleReader进行读取，中文是好的。

代码如下：

@Override
	public void characters(char[] ch, int begin, int length) throws SAXException {
		StringBuffer buffer = new StringBuffer();
		for(int i = begin ; i < begin+length ; i++){
			switch(ch[i]){
				case '\':buffer.append("\\");break;
				case 'r':buffer.append("\r");break;
				case 'n':buffer.append("\n");break;
				case 't':buffer.append("\t");break;
				case '"':buffer.append("\"");break;
				default : buffer.append(ch[i]);	
			}
		}
		System.out.println(this.toBlankString(this.frontBlankCount)+
				">>> characters("+length+"): "+buffer.toString());
	}

输出片段：

>>> characters(1): 不
                                    >>> characters(1): 少
                                    >>> characters(1): 渠
                                    >>> characters(1): 道
                                    >>> characters(1): 推
                                    >>> characters(1): 广
                                    >>> characters(1): 的
                                    >>> characters(1): 力
                                    >>> characters(1): 气
                                    >>> characters(1): ，
                                    >>> characters(1): 阿
                                    >>> characters(1): 里
                                    >>> characters(1): 云
                                    >>> characters(1): 能
                                    >>> characters(1): 帮
                                    >>> characters(1): 助
                                    >>> characters(1): 更
                                    >>> characters(1): 多

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

小瓶盖 2021-11-21 08:56:53

结贴，XML格式不正确，将网页下载下来以后用记事本打开中文就是#12311#12311#12311 之类的东西，好像是unicode 无BOM格式的还是什么的。

高跟鞋的旋律 2021-11-21 01:31:23

XML的格式是什么？？

~没有更多了~

关于作者

每个人心里都住着一个人，或眷念，或暗恋，或想念。

文章

评论

23718 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

櫻之舞

文章 0 评论 0

弥枳

文章 0 评论 0

m2429

文章 0 评论 0

寻找一个思念的角度

文章 0 评论 0

野却迷人

文章 0 评论 0

我怀念的。

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文