解析 html 与不良标签实现的模式匹配,以使用 JSOUP 检索信息

发布于 2024-12-15 17:51:52 字数 1390 浏览 0 评论 0原文

我正在使用 java 和 jsoup 来解析网站,问题是,我需要的很多信息没有被标签包围。

例如,下面的每个

都有 2 个不同人的电话号码。一个人有电话,而另一个人没有。

<p class="contact-info">Tel: <strong> 059-9162997</strong> | Mob: <strong>087-2280039</strong></p>
 <p class="contact-info">Mob: <strong>086 7726712</strong></p>

我如何解析/模式匹配此信息来检索

人员 1 -----> 059-9162997、087-2280039

2人-----> 086 7726712

另外,我如何检索此信息

<p class="contact-info">Address: <strong>Suite 26, Unit 1, North Park, North Road,Dublin 11, Dublin</strong> <br />Email: <a href="mailto:[email protected]">[email protected]</a><br />Website: <a href="http://www.swillydrive.ie">http://www.swillydrive.ie</a></p>

地址 ----->Suite 26, Unit 1, North Park, North Road,Dublin 11, Dublin 电子邮件 --------> [电子邮件受保护] 网站 ------>http://www.swillydrive.ie

谢谢

i am using java with jsoup to parse a website, trouble is , alot of the information i needed isnt surrounded by tags.

for example , each <p> below has telephone number/s for 2 different people. one person has a telephone while the other does not.

<p class="contact-info">Tel: <strong> 059-9162997</strong> | Mob: <strong>087-2280039</strong></p>
 <p class="contact-info">Mob: <strong>086 7726712</strong></p>

How could i parse/ pattern match this information to retrieve

person 1 -----> 059-9162997, 087-2280039

person 2 -----> 086 7726712

Also how would i retrieve the information for this

<p class="contact-info">Address: <strong>Suite 26, Unit 1, North Park, North Road,Dublin 11, Dublin</strong> <br />Email: <a href="mailto:[email protected]">[email protected]</a><br />Website: <a href="http://www.swillydrive.ie">http://www.swillydrive.ie</a></p>

where

Address ----->Suite 26, Unit 1, North Park, North Road,Dublin 11, Dublin
email -------> [email protected]
website ------>http://www.swillydrive.ie

thanks

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

深居我梦 2024-12-22 17:51:53

您可以根据需要使用 jsoup 选择一些数据,如此处所述。

在您的情况下,您需要选择所有带有 contact-info 类的 p 标记,然后选择其中的 strong 标记。语法允许您像这样编写:

p.contact-info strong

在 Java 中,给出:

Elements elements = document.select("p.contact-info strong");
for (Element element : elements) {
    String phoneNumber = element.text();
}

You can use jsoup to select some data depending on what you need, as described here.

In your case, you need to select all p tag with the contact-info class, and then the strong tag in it. The syntax allows you do write it like this:

p.contact-info strong

Which, in Java, gives:

Elements elements = document.select("p.contact-info strong");
for (Element element : elements) {
    String phoneNumber = element.text();
}
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文