爪哇。比较网页结构 (dom) 相似度。

发布于 2024-12-27 07:25:00 字数 181 浏览 2 评论 0原文

是否有一个库(用于java)可以比较网页之间的相似性(HTML,dom相似性)?

在我的应用程序中,我想对网站的链接进行分类。 例如: 第 1 组:产品详细信息页面 第2组:类别页面(用于在线购物网站等)。

对于这样的分类html结构(dom)相似度是我认为最好的方式。请帮忙解决这个问题。

Is there a library (for java) that compares similarity between web pages (HTML, dom similarity)?

In my application I want to classify links of a website.
For example:
group 1: Product detail page
group 2: Category page
(for online shopping sites, etc.).

For such a classification html structure (dom) similarity is the best way I think. Please help regarding this.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

长途伴 2025-01-03 07:25:00

不完全符合您的要求,但如果 HTMl 是 XML 有效的,您可以使用 XMLUnit,它是 非常简单与其比较相似度。

Not exactly what you ask but if the HTMl is XML valid you can use XMLUnit, it's very simple to compare similarity with it.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文