Xquery 使用 解析文本标签
我正在使用 XQuery 从 html 页面中提取内容。 html 主体结构是这样的:
<td>
<a href ="hw1">xyz </a>
Hello world 1
<a href="hw2">Helloworld 2</a>
Helloworld 3
</td>
我用于提取文本的 XQuery 表达式如下:
//a[starts-with(@href,'hw1')]/following-sibling::text()
这个表达式给了我:
Helloworld 1 Helloworld 2 Helloworld 3
我想以这种方式拥有它: Helloworld 1 Helloworld 2 Helloworld 3 或 Helloworld 1 Helloworld 3
如何指定解析标签包含的文本
I am using XQuery to extract content from html pages. The html body structure is of this kind:
<td>
<a href ="hw1">xyz </a>
Hello world 1
<a href="hw2">Helloworld 2</a>
Helloworld 3
</td>
My XQuery expression for extracting the text is as follows:
//a[starts-with(@href,'hw1')]/following-sibling::text()
This expression gives me :
Helloworld 1 Helloworld 2 Helloworld 3
I would like to have it in this fashion:
Helloworld 1 Helloworld 2 Helloworld 3 or
Helloworld 1 Helloworld 3
How do I specify to parse the text enclosed by tags
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我不太清楚您在寻找什么,但
直接在 下为您提供了文本节点。我没有看到你得到的和你想要的之间有什么区别......也许你的帖子丢失了一些格式?
I'm not really clear what you're looking for, but
gives you the text nodes directly under the <td>. I don't see a difference between what you're getting and what you want... perhaps your post lost some formatting?