爬取 携程国际机票,大家有好的方法吗

发布于 2022-09-06 19:52:47 字数 172 浏览 14 评论 0

1.最近再做爬取携程的国际机票,之前没写过爬虫,边看边学,发现网上有很多爬取携程国内机票的教程,爬取国际机票的很少。
2.因为携程是异步加载的并且参数很多,还有动态的参数,看着比较麻烦。所以我现在是用的 selenium来模拟浏览器抓取的。但是效率又太低。大家一般抓取这样的网站采取什么技术或方法,麻烦有了解这方面的指点一下

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

甜警司 2022-09-13 19:52:47

刚看了下携程的网址.

这个url是北京(BJS)到布拉格(PRG) 2018-04-11 当天的全部机票.
http://flights.ctrip.com/inte...

这个url是北京(BJS)到雅典(ATH) 2018-04-03 当天的全部机票.
http://flights.ctrip.com/inte...

两个url只是城市的编号不同. 如果想获取北京到世界各地的机票信息. 只需要拼接下DCity就可以获取到

想获取 2018-04-012 的机票, 就把日期改一下.
这样就获取到了url.然后模拟发起请求,获取请求页面的Document树,在去解析里面的数据.
感觉还可以.并不是特别难. 难点就是获取各个城市的标号.
另外如果携程有反爬虫,可以用代理ip.这样成功率会高很多.不会被封.

鱼窥荷 2022-09-13 19:52:47

@可好了 谢谢你的回复,我已经把需要的飞机场代码给爬取到了我是使用的这个地址拼装的http://flights.ctrip.com/inte... ,现在的主要是效率,太低。模拟一次请求,需要大概20秒的时间,才能把整个航线的航班数据爬取下来。 多线程的跑selenium 有很多问题。今天在看一下

梦中楼上月下 2022-09-13 19:52:47

我今天也遇到这个问题了,模拟参数请求返回为空
图片描述

薯片软お妹 2022-09-13 19:52:47

这里写了相关解决办法
https://blog.csdn.net/blowfir...

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文