如何获取文本和使用 Jericho HTML 解析器的特定标签之间的其他标签?
我有一个包含特定标签的 HTML 文件,例如 ,结束标签是
。现在我想获取这些标签之间的所有内容。我正在 Java 中使用 Jericho HTML 解析器来解析 HTML。是否可以获取文本& Jericho 解析器中特定标签之间的其他标签?
例如:
<TABLE cellspacing=0>
<tr><td>HELLO</td>
<td>How are you</td></tr>
</TABLE>
回答:
<tr><td>HELLO</td>
<td>How are you</td></tr>
I have a HTML file which contains a specific tag, e.g. <TABLE cellspacing=0>
and the end tag is </TABLE>
. Now I want to get everything between those tags. I am using Jericho HTML parser in Java to parse the HTML. Is it possible to get the text & other tags between specific tags in Jericho parser?
For example:
<TABLE cellspacing=0>
<tr><td>HELLO</td>
<td>How are you</td></tr>
</TABLE>
Answer:
<tr><td>HELLO</td>
<td>How are you</td></tr>
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
一旦找到表的元素,您所要做的就是调用 getContent().toString()。以下是使用示例 HTML 的快速示例:
输出:
Once you have found the Element of your table, all you have to do is call getContent().toString(). Here's a quick example using your sample HTML:
Output:
Aby,我遍历所有元素的代码并显示在屏幕上。也许对你有帮助。
Aby, I walk down the code for all elements and show on screen. Maybe help you.