有没有可能爬淘宝,获取商品信息?

发布于 2022-09-06 02:51:02 字数 72 浏览 22 评论 0

我们想做电子商务垂直行业分析,想爬取淘宝的商品信息。淘宝的商品信息使用了很多ajax技术,尤其是评论部分;请问有什么好的方案么?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(6

攒一口袋星星 2022-09-13 02:51:02

有两种方案

  • 抓取网页后,用webkit的内核渲染网页
  • 人工构造Ajax的URL,获取Ajax内容后提取信息

目前我司用的是第二种方法,已经抓取了亿级别的淘宝商品

我一直都在从未离去 2022-09-13 02:51:02

淘宝提供了一套丰富的API的,不必写爬虫去翻。
http://open.taobao.com/doc/category_list.htm?id=102

查看商品评价的方法:取得了商品的 num_iid 后,调用 taobao.traderates.get 这个API

你的背包 2022-09-13 02:51:02

爬过,评论详情是ajax的,比较难获取,商品信息还是可以的。
这是我写的简单的爬虫(http://pfffinc.diandian.com/post/2013-01-14/40047366704

半夏半凉 2022-09-13 02:51:02

最长用的方法是搜索关键字,
通过关键字的信息返回商品ID,
在通过商品ID来搜索商品。
[http://open.taobao.com/doc/api_cat_detail.htm?spm=0.0.0.0.niihQi&cat_id=38&category_id=102]

独闯女儿国 2022-09-13 02:51:02

在没太多线路资源,抓取频率又不低的情况下,还要解决随时出现的验证码。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文