将 HTML 转换为 RDF
我正在寻找一个通用的 API/Web 服务/工具/等等...它允许将给定的 HTML 页面转换为尽可能具体的 RDF 图(最有可能使用主干本体和/或映射器)。
I'm looking for a general purpose API/web service/tool/etc... that allows convert a given HTML page to an RDF graph as specific as possible (most probably using a back bone ontology and/or mapper).
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
你证明了GRDDL了吗?
Have you proved GRDDL?
我使用 XQuery 从给定的网页集中提取数据。我必须为网页编写自定义查询。我认为这是针对一组特定 HTML 文件采取的最直接的方法。但对于一般情况来说,这显然不太好。对于不同的网页集,需要编写其他自定义查询。
I used XQuery to extract the data out of the given set of web pages. I had to write custom queries for the web pages. I think this is the most straight forward approach to take for a specific set of HTML files. However, it is obviously not good for the general case. For a different set of web pages other custom queries are need to be written.
我使用 JSoup 从 HTML 中抓取数据。它使用 jQuery 风格来查询 HTML DOM,我已经很熟悉了,所以对我来说这是一个非常简单的工具。我也为它提供了相当强大的资金,但我只需要它来抓取 3 个数据源,所以我对这个工具还没有丰富的经验。 jsoup
I used JSoup to scrape data from HTML. It uses jQuery style of querying HTML DOM, wich I was already famirial with, so it was realy simple tool to use for me. I also fund it quite robust but I needed it just to scrape 3 datasources so I dont have rich experience with this tool yet. jsoup