用于从网站提取信息的 Web API

发布于 2024-11-11 04:33:37 字数 1540 浏览 0 评论 0 原文

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

不醒的梦 2024-11-18 04:33:37

您应该查看 YQL - 这是 Yahoo! 的一项通用服务!可以非常轻松地进行这种抓取。试试这个:

select * from html where url="google.com" and xpath='//title'

在这里测试一下。

You should have a look at YQL - it's a general-purpose service from Yahoo! that can do this kind of scraping really easily. Try this:

select * from html where url="google.com" and xpath='//title'

Test it here.

秋日私语 2024-11-18 04:33:37

我怀疑 Yahoo! 的 YQL 可能非常接近您正在寻找的内容。

(事实上​​,我认为对 YQL 的简洁描述是“从网站提取信息的 Web API”:-)

I suspect that Yahoo!'s YQL is probably pretty close to what you're looking for.

(In fact I think that a concise description of what YQL is would be, "a web API to extract information from a website" :-)

情深如许 2024-11-18 04:33:37

您可以使用Rapture Parser。它允许您从网页检索内容和许多其他元数据

You may use Rapture Parser. It allows you to retrieve a content and a lot of other metadata from the web page

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文