编写屏幕抓取爬虫

发布于 2024-08-27 01:29:43 字数 526 浏览 7 评论 0原文

我想编写用于屏幕抓取的爬虫

我想要的是,我想从网站获取特定酒店的价格,如下所示 网站

例如在上面的 URL 中,有是酒店及其价格的列表。我想获得 the beaufort 的价格,

请告知如何完成此操作。

I want to write crawler for screen scraping

What I want is, I want to get price of particular hotel from a website, like here is
website

e.g. In the above URL, there is list of hotels and its price. I want to get the price of the beaufort

Please Advise how to accomplish this.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

陈甜 2024-09-03 01:29:43

使用 HTML 解析库(例如 html 敏捷包)将 html 解析为更可用的模型,然后导航用于查找您感兴趣的 HTML 部分的模型

use a HTML parsing library like the html agility pack to parse the html into a more usable model and then navigate the model to find the bits of the HTML you are interested in

几度春秋 2024-09-03 01:29:43

使用 cURL 等工具下载 HTML,然后使用 XPath 选择您感兴趣的标签使用 Firebug 帮助您确定 XPath。

download the HTML with a tool like cURL and then use XPath to select the tags you are interested in. Use Firebug to help you determine the XPath.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文