LXml Xpath处理多行字段

发布于 2024-09-14 06:24:58 字数 317 浏览 6 评论 0原文

我正在对页面进行一些抓取,并且可以很好地获取大多数字段,但地址存在一些问题。

<address>
  56 South Ave
  <br>
  Miami, FL 33131
  <br>
</address>

address = myWebPage.xpath("//div[contains(@class,'rightcol')]//address")

使用上面的代码我可以得到第一行,56 South Avenue。但我无法获取城市、州、邮政编码。我如何更改代码以获得完整地址?

I'm doing some scraping of a page and I'm fine with getting most fields, but having some problems with the address.

<address>
  56 South Ave
  <br>
  Miami, FL 33131
  <br>
</address>

address = myWebPage.xpath("//div[contains(@class,'rightcol')]//address")

I can get the first line, 56 South Avenue, using the above code. But I can't get the city, state, zip. How would I change the code to get the full address?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

污味仙女 2024-09-21 06:24:58
//div[contains(@class,'rightcol')]//address/text()[1]

选择address 的第一个文本节点子节点:

"  
  56 South Ave   
  "

//div[contains(@class,'rightcol')]//address/text()[2]

选择address 的第二个文本节点子节点:

"       
  Miami, FL 33131       
  "

//div[contains(@class,'rightcol')]//address/text()

选择address 的两个文本节点子节点。

//div[contains(@class,'rightcol')]//address/text()[1]

selects the first text-node child of address:

"  
  56 South Ave   
  "

//div[contains(@class,'rightcol')]//address/text()[2]

selects the second text-node child of address:

"       
  Miami, FL 33131       
  "

//div[contains(@class,'rightcol')]//address/text()

selects both text-node children of address.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文