HTMLParser无法解析tbody的情况
Parser htmlParser = Parser.createParser("<table id='_table' border='0' cellspacing='0' cellpadding='0' class='tableRegion' width='100%' ><thead><tr><td>1</td><td>2</td></tr></thead><tbody id='_table_body' ><tr><td>4</td><td>5</td></tr></tbody></table>","gbk"); NodeFilter filter = new HasAttributeFilter("id", "_table_body"); NodeFilter f = new AndFilter(new TagNameFilter("tr"), new HasParentFilter(filter)); NodeList nodelist1 = htmlParser.parse(filter); //输出:Tag (144[0,144],173[0,173]): tbody id='_table_body' NodeList nodelist2 = htmlParser.parse(f); //没有任何节点
上面nodelist1的输出内容为什么不是
<tbody id='_table_body' ><tr><td>4</td><td>5</td></tr></tbody>呢?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
上面期望输出打错了
找到个Php的答案。忽略了tbody
http://stackoverflow.com/questions/2340952/tbody-glitch-in-php-simple-html-dom-parser