hpple html 逐块解析还是逐属性解析?

发布于 2024-10-22 12:51:48 字数 589 浏览 2 评论 0原文

我对 hpple 和 xpath 很陌生。对于下面的html代码,我想获取“标题”和“标签”信息。

从 hpple 的示例代码中,我可以获得一个标题数组和另一个标签数组。但如果我感兴趣的属性有六个,那么就会有六个数组。

我可以找到 div[class="entry"],然后获取其子级的 div[class="meta"] 吗? (有人可以分享代码吗?)

谢谢。

<div class="content">

<div id="1" class="entry">
  <h2 class="title"> title for  entry 1 </h2>
 <div class="meta"> tag:xxx </div>
</div>

<div id="2" class="entry">
  <h2 class="title"> title for  entry 2 </h2>
 <div class="meta"> tag:xxx </div>
</div>

...

</div>

I'm new about hpple and xpath. for the below html code,I want to get both "title" and "tag" information.

From hpple's example code, I can get a array of title, and another array of tag. But if there are six properties I'm interested, there will be six arrays.

can I find the div[class="entry"], then get its child's , div[class="meta"]? (can anybody share the code?)

Thanks.

<div class="content">

<div id="1" class="entry">
  <h2 class="title"> title for  entry 1 </h2>
 <div class="meta"> tag:xxx </div>
</div>

<div id="2" class="entry">
  <h2 class="title"> title for  entry 2 </h2>
 <div class="meta"> tag:xxx </div>
</div>

...

</div>

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

情深缘浅 2024-10-29 12:51:48
@"//div[@class='content']//div[@class='entry']//div[@class='meta']"

这将返回两个条目的 tag:xxx。

@"//div[@class='content']//div[@class='entry']//div[@class='meta']"

This returns tag:xxx for both entries.

沙沙粒小 2024-10-29 12:51:48

我想同时获取“标题”和“标签”信息

//div[@class='content']/div[@class='entry']/*[@class='meta' or @class=title"']

此 XPath 获取 div 类条目子级的 类标题或元子级的所有标签任何 div 类内容

I want to get both "title" and "tag" information

//div[@class='content']/div[@class='entry']/*[@class='meta' or @class=title"']

This XPath gets all tags with class title or meta children of div class entry child of any div class content.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文