当前位置：文江博客话题详情

JavaScript screen-scraping

屏幕抓取使用 javaScript 和框架的网页

发布于 2024-08-20 12:38:35 字数 415 浏览 10 评论 0原文

我想从 www.marktplaats.nl 抓取数据。我想在 Excel/Access 中分析抓取的描述、价格、日期和视图。

我尝试使用 Ruby（nokogiri、scrapi）抓取数据，但没有任何效果。（在其他网站上它运行良好）主要问题是，例如selectorgadget和附加firebug（Firefox）找不到任何我可以用来抓取页面的css。在其他网站上，我可以使用selectorgadget或firebug提取css，并将其与nokogiri或scrapi一起使用。由于缺乏经验，很难识别问题，因此寻找解决方案并不容易。

您能告诉我从哪里开始解决这个问题以及我在哪里可以找到有关类似抓取过程的更多信息吗？

提前致谢！

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

陈独秀 2024-08-27 12:38:35

我使用了 Excel Web 查询，效果非常好。如果您搜索 mrexcel，您可以在 youtube 上找到很多有关使用 excel 进行抓取的信息。
谢谢，梅洛

回复收藏 0 原文

素手挽清风 2024-08-27 12:38:35

您可以尝试 IRobotSoft 网络抓取工具。它具有良好的框架支持并且是免费的。

回复收藏 0 原文

断肠人 2024-08-27 12:38:35

iframe 不是问题 - 只需直接访问嵌入的 iframe URL 即可。你会发现它会在浏览器中重定向，除非你禁用 JavaScript。

描述和日期可以直接从 HTML 源代码中提取。然而，价格是图像，这将使抓取它们变得更加麻烦。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

╭⌒浅淡时光〆

文章 0 评论 0

慕巷

文章 0 评论 0

浅生活

文章 0 评论 0

bal

文章 0 评论 0

lqwuliang

文章 0 评论 0

后来的我们

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文