web-scraping

web-scraping

文章 0 浏览 2

使用SoupStrainer选择性解析

我正在尝试解析购物网站上的视频游戏标题列表。然而,由于项目列表全部存储在标签内。 这个&lt文档的 /a&gt 部分据说解释了如何仅解析文档的一部分,…

有深☉意 2024-09-29 02:49:08 3 0

抓取 .HTM 文件时遇到问题

我刚刚开始从网页上抓取基本文本,目前正在使用 HTMLAgilityPack C# 库。我在竞争对手.yahoo.com 上取得了一些成功(体育是我的爱好,所以为什么不抓…

逆夏时光 2024-09-28 02:19:38 0 0

ruby 屏幕抓取脚本中的问题

我有一个小的爬虫/屏幕抓取脚本,半年前可以工作,但现在它不再工作了。我检查了页面源中reg表达式的html和css值,但它们仍然相同,所以从这个角度来…

喜你已久 2024-09-28 02:03:52 1 0

选择哪种语言从指定页面获取数据?

Closed. This question is opinion-based. It is not currently accepting answers. 想要改进这个问题?更新问题,以便可以通过编辑这篇文章用事实和…

琉璃梦幻 2024-09-27 23:08:11 0 0

如何在 Google App Engine 上执行网页抓取以查找 Java 中的特定链接页面?

我需要从不提供 RSS 源的远程网站检索文本。 我所知道的是,我需要的数据始终位于从主页 (http://www.example.com/) 链接到的页面上,其中包含文本“ …

美男兮 2024-09-27 19:04:25 0 0

禁用 cURL 和allow_url_fopen 时如何抓取网站

我知道有关 PHP 网页抓取工具的问题已经被多次询问,并且使用这个问题,我发现了 SimpleHTMLDOM。在我的本地服务器上无缝工作后,我将所有内容上传到…

胡大本事 2024-09-26 15:06:49 0 0

任何脚本语言都可以读取 AJAX/Java 脚本吗? (Linux)

有什么方法可以抓取使用AJAX的网页吗? 通过在linux服务器上使用诸如ruby + mechanize之类的东西,没有连接监视器(例如linode.com) http://watir.co…

陌路终见情 2024-09-26 06:02:44 1 0

可以机械化读取ajax吗? (红宝石)

我可以使用 ruby​​ 中的 mechanize 获得通过 AJAX 显示的正确数据/文本吗? 或者还有其他脚本宝石可以让我这样做吗?…

故事灯 2024-09-26 02:54:49 0 0

在 Rails 3 中使用 Scrapi.. 出现分段错误错误/中止陷阱

到目前为止我所做的.. sudo gem install scrapi sudo gem install tidy 这不起作用,因为它没有 libtidy.dylib 所以我这样做了: sudo port install t…

橘味果▽酱 2024-09-25 15:23:35 0 0

网络抓取 Groupon

我现在想废掉 groupon.com 我的问题是这样的网站,当您第一次加载时,会要求您加入他们的电子邮件服务,但当您重新加载页面时,它们会直接向您显示页…

冷弦 2024-09-25 15:22:00 0 0

如何从电子邮件地址识别网络邮件服务?

如果我有电子邮件地址,例如 [电子邮件受保护] 我可以从gmail.com域名识别出它属于gmail webmail服务。还有属于同一服务的 googlemail.com 地址。 是…

东风软 2024-09-25 02:48:29 0 0

如何在 Perl 网络爬虫中处理 Javascript?

我想抓取一个网站,问题是,它充满了 JavaScript 的东西,比如按钮等,当按下它们时,它们不会改变 URL,但页面上的数据会改变。 通常我使用 LWP / Me…

不知在何时 2024-09-24 14:52:54 1 0

卷曲问题,无法下载完整网页

使用此代码,我尝试下载此网页: http://www.kayak.com/s/... $ch = curl_init() curl_setopt($ch, CURLOPT_URL,'http://www.kayak.com/s/search/air?…

软糖 2024-09-24 09:35:33 0 0

用Javascript解析SHOUTcast服务器信息表?

我目前正在尝试解析html页面 http://84.19.184.204:8000/played.html&lt /a&gt 使用 JS。 但这很难,因为我是 JS 新手...html 页面包含一个表格,其中…

怀里藏娇 2024-09-19 18:20:09 3 0

尝试抓取 div 的整个内容

我正在开发这个项目,我想使用来自 touch.facebook.com 的 iframe 中的 facebook 地点添加一个非常小的附近地点列表,我可以轻松地使用 touch.faceboo…

莫多说 2024-09-18 20:41:57 2 0
更多

推荐作者

lioqio

文章 0 评论 0

Single

文章 0 评论 0

禾厶谷欠

文章 0 评论 0

alipaysp_2zg8elfGgC

文章 0 评论 0

qq_N6d4X7

文章 0 评论 0

放低过去

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文