hpple html 逐块解析还是逐属性解析?
我对 hpple 和 xpath 很陌生。对于下面的html代码,我想获取“标题”和“标签”信息。
从 hpple 的示例代码中,我可以获得一个标题数组和另一个标签数组。但如果我感兴趣的属性有六个,那么就会有六个数组。
我可以找到 div[class="entry"],然后获取其子级的 div[class="meta"] 吗? (有人可以分享代码吗?)
谢谢。
<div class="content">
<div id="1" class="entry">
<h2 class="title"> title for entry 1 </h2>
<div class="meta"> tag:xxx </div>
</div>
<div id="2" class="entry">
<h2 class="title"> title for entry 2 </h2>
<div class="meta"> tag:xxx </div>
</div>
...
</div>
I'm new about hpple and xpath. for the below html code,I want to get both "title" and "tag" information.
From hpple's example code, I can get a array of title, and another array of tag. But if there are six properties I'm interested, there will be six arrays.
can I find the div[class="entry"], then get its child's , div[class="meta"]? (can anybody share the code?)
Thanks.
<div class="content">
<div id="1" class="entry">
<h2 class="title"> title for entry 1 </h2>
<div class="meta"> tag:xxx </div>
</div>
<div id="2" class="entry">
<h2 class="title"> title for entry 2 </h2>
<div class="meta"> tag:xxx </div>
</div>
...
</div>
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
这将返回两个条目的 tag:xxx。
This returns tag:xxx for both entries.
此 XPath 获取 div 类条目子级的 类标题或元子级的所有标签任何 div 类内容。
This XPath gets all tags with class title or meta children of div class entry child of any div class content.