screen-scraping

screen-scraping

文章 0 浏览 5

为什么我会收到“错误的状态行” Nokogiri 的错误?

我的 Ruby/Nokogiri 脚本是: require 'rubygems' require 'nokogiri' require 'open-uri' f = File.new("enterret" + ".txt", 'w') 1.upto(100) do |…

铁憨憨 2024-12-17 21:40:39 0 0

通过 get_file_contents() 解析 html

有人告诉我们,解析 html 的最佳方法是通过 DOM,如下所示: loadHTML( $html); $elements = $d…

丘比特射中我 2024-12-17 19:37:57 0 0

JSoup 和我无法抓取的网站

我正在学习使用 JSoup,为此我从一个包含足球比赛的网站开始。我不擅长html,这可能是问题所在,无论如何,我检查了网站的代码以了解如何检索我需要的…

遇见了你 2024-12-17 15:07:09 0 0

iMacros - 提取 TD 标签内的部分文本

请访问链接 http://www.networksolutions.com/whois-search/reedandthomas。 com 我只想提取文本的以下部分: Administrative Contact: Chilcoat, Dan…

半透明的墙 2024-12-17 05:05:53 0 0

将 cookie 传递到登录页面

我正在尝试从在 Asp.Net Webforms 上运行的网页中抓取数据。我查看了此页面来执行此操作。它看起来像是我不想做的,但我不会让它开箱即用,因为登录页…

浮世清欢 2024-12-17 03:18:13 0 0

从字符串、正则表达式中提取变量?

我的困惑:作为 PHP 新手,我尝试使用正则表达式从字符串中提取一些数据,但我找不到正确的语法。 字符串的内容被抓取为网站上多个图像的 html,我希…

疾风者 2024-12-16 20:29:58 0 0

从 NHL.com 抓取数据

我正在尝试从 http://www.nhl.com/ice/stands.htm?season=20112012&type=LEA" rel="nofollow">http://www. nhl.com/ice/stands.htm?season=20112012&t…

动听の歌 2024-12-16 00:52:39 1 0

python 2.7 中的正则表达式和 csv 问题

使用以下方法修复问题(对于其余问题,将更改我的代码)。很抱歉我最初的帖子中的代码格式不正确。 import csv, re, mechanize htmlML = br.response(…

花开半夏魅人心 2024-12-15 20:57:21 1 0

直接 LXML 或 PyQuery

有人有使用直接 lxml 与 PyQuery 进行抓取的经验吗?我最近才发现后者并且很感兴趣。我还没有找到很多关于这个库的评论,所以我很好奇它有多强大。 我…

讽刺将军 2024-12-15 16:09:19 1 0

对象调试器错误抓取页面...接近解决方案吗?

我在共享页面时遇到一个非常奇怪的问题,可能连接到 Facebook 使用的 DNS。 我通常分享我自己网站上的页面,没有任何问题。仅在一个新网站中,我无法…

左耳近心 2024-12-15 15:27:28 1 0

用卷曲进行屏幕刮擦

到目前为止,我编写的 cURL 代码在自动将我登录到网站后显示了我想要的页面,但是我陷入了屏幕抓取的问题。我现在想从这些数据中整理出更多信息。这是…

叫思念不要吵 2024-12-15 06:20:50 1 0

如何在 Ruby 中使用 Mechanize 选择单选按钮?

我正在构建一个爬虫,并且正在使用 Mechanize。我希望单击一个单选按钮。我该怎么做? 例如,有两个单选按钮,分别为“A”和“B”。 该网站自动选择 B…

心病无药医 2024-12-14 22:48:36 1 0

如何以编程方式登录网站

我不知道如何以编程方式登录此网站 我搜索了 stackoverflow 并找到了这个,但我仍然不知道不知道要在 URL 或 URI 中放入什么。…

待"谢繁草 2024-12-14 22:42:00 2 0

将 WinForms 应用程序发布为 html 5 canvas

我们已经有了一个大小合适的 WinForms 应用程序,我们正在逐步将其替换为 mvc Web 应用程序。 我想找到一种通过屏幕抓取工具或类似工具发布 WinForms …

淡莣 2024-12-14 22:25:06 1 0

如何使用 Objective-C 在 iOS 中模拟网页点击

我正在寻找适用于 iOS 的 Mechanize(Ruby/python 等)的等效版本。 我需要模拟网页中的点击(表单提交)并获取响应。我尝试使用 ASIHTTPRequest 构造…

信愁 2024-12-14 20:26:47 2 0
更多

推荐作者

亚希

文章 0 评论 0

cyp

文章 0 评论 0

北漠

文章 0 评论 0

11223456

文章 0 评论 0

坠似风落

文章 0 评论 0

游魂

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文