将 HTML/XML 网站转换为 RDF

发布于 2024-10-15 11:50:46 字数 1536 浏览 5 评论 0原文

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

过期以后 2024-10-22 11:50:47

一般来说,自动转换是不可能的,因为 HTML 说明了某些内容的外观,而不是它的含义。如果 HTML 包含现有标记,您可以使用 Anything2Triples (http://developers.any23.org/) 来获取 RDF。

如果它只是 HTML,您必须以某种方式编写自己的提取规则。 GRDDL 可以工作,但我可能会简单地使用 python + BeautifulSoup。这取决于您已经掌握的技术/语言!

In general, an automatic conversion is not possible, since HTML says what something looks like, and not what it means. If the HTML contains existing markup, you could use Anything2Triples (http://developers.any23.org/) to get RDF out.

If it's just HTML you have to write your own extraction rules somehow. GRDDL would work, but I would probably simply use python + BeautifulSoup. It depends what technology/language you know already!

哽咽笑 2024-10-22 11:50:47

如果 HTML 包含嵌入的 RDFa,您可以使用 RDFa 解析器来提取信息。有适用于各种平台和语言的解析器,因此取决于您的开发环境。

If the HTML contains embedded RDFa the you can use an RDFa parser to extract the information. There are parsers available for various platforms and languages so depends on your development environment.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文