关于抓取淘宝产品页数据的方法

发布于 2021-11-28 01:16:05 字数 1160 浏览 939 评论 7

最近学习爬虫抓取淘宝的信息,看了一些代码。有些问题,向各位请教

http://hws.m.taobao.com/cache/wdetail/5.0/?id=XXXXXXXXX

这个地址是什么地址?能获取到产品页信息,但是去淘宝开放平台也没查到这种接口,

百度也找不到一点信息。

开始的时候,我以为直接抓这种页面(大家平时买东西浏览的页面):

https://item.taobao.com/item.htm?id= XXXXXXXX

最后请问大家抓淘宝信息一般怎么抓?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(7

不再见 2021-12-03 20:16:50

神箭手云爬虫平台的淘宝商品信息及评价采集爬虫(按商品搜索关键字)支持云端自动采集,试试监控更新~

爬虫链接:http://www.shenjianshou.cn/index.php?r=market/configDetail&pid=119

灵芸 2021-12-03 19:38:20

可以一试

刘备忘录 2021-12-03 18:23:50

简单来说,最好用淘宝客的API,不要直接爬它的展示页,https://open.taobao.com/doc2/apiList.htm?spm=a219a.7629065.0.0.gKVdeE&cid=38

多看没有用,不知现在还能不能用。

酷到爆炸 2021-12-03 15:35:06

我抓取的量比较小,也就抓几个产品页,不停的刷新,貌似没屏蔽我

谁的新欢旧爱 2021-12-03 13:03:13

它有策略的 我试过重复抓几次IP地址就会被屏蔽的。试过免费的代理服务器 不是很稳定的

情场扛把子 2021-12-03 08:31:24

话说为啥他会免费给人家用,产品信息不也是个很重要的资源吗

各自安好 2021-12-02 19:22:03

回复
你放心好了。应该是有反爬策略。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文