screen-scraping

screen-scraping

文章 0 浏览 4

获取 Hpricot 中元素的类型

我想遍历元素的子元素并仅过滤文本或 span 元素,例如: element.children.select {|child| child.class == String || child.element_type == 'span' …

赤濁 2024-08-09 07:01:55 4 0

DownloadData() 生成与浏览器不同的 HTML

我正在尝试使用 WebClient.DownloadData() 方法下载网站的源 HTML。 我的方法应该给我来源: public string GetSite(string URL) { Uri Site = new Ur…

看轻我的陪伴 2024-08-08 20:42:01 2 0

使用 Rake 抓取 ASP.NET 页面

是否可能,如果可以,如何使用 RAKE 抓取 ASP.Net 应用程序(非常简单,只有 2 个登录表单)- 基本上是一个蜘蛛机器人/网络爬虫。 我只是问因为我以前…

下壹個目標 2024-08-08 16:09:01 2 0

这个异步下载可以吗? WebClient.DownloadDataAsyn() 问题

我有一个名为 SiteAsyncDownload.cs 的类, 代码如下: public class SiteAsyncDownloader { WebClient Client = new WebClient() string SiteSource …

旧人 2024-08-08 14:02:43 5 0

抓取有问题的网站

我正在尝试从网站上抓取一些信息,但在阅读相关页面时遇到问题。这些页面似乎首先发送基本设置,然后发送更详细的信息。我的下载尝试似乎只捕获了基本…

陌路黄昏 2024-08-08 04:34:31 4 0

如何截取指定网站的截图?

如果我有 google fastflip 等网站的网址列表,我想知道捕获屏幕截图的技术。此类任务需要什么技术或技巧。如果这项技术可以在 Rails 中使用那就太好了…

老旧海报 2024-08-08 03:52:10 5 0

如何在此上下文中使用 WebClient.DownloadDataAsync() 方法?

我的计划是让用户在我的程序中写下电影标题,我的程序将异步提取适当的信息,这样 UI 就不会冻结。 这是代码: public class IMDB { WebClient WebCli…

痴者 2024-08-07 22:47:54 3 0

处理屏幕抓取对象的更好方法

在我的应用程序中,我总是最终实现模型-视图-演示者模式,并且通常最终会使用 get 属性从屏幕上废弃我的视图对象。 例如 Person IBasicRegistration.P…

复古式 2024-08-07 17:04:30 4 0

Scrubyt 获取元数据

如何使用 Scrubyt 获取元名称=“描述”内容=“.....”的内容? require 'rubygems' require 'scrubyt' data = Scrubyt::Extractor.define do fetch 'h…

苦笑流年记忆 2024-08-07 16:48:08 4 0

HTML 解析/抓取算法帮助..Java

我正在编写一个 HTML 抓取程序的程序,当它从页面中抓取 HTML 时,它会返回 HTML,我想抓取全部大写字母的单词,然后将这些单词存储到数据库中。我现…

飘然心甜 2024-08-07 13:39:05 3 0

刮擦有问题

我正在尝试从文本文件的列表中、从域中抓取一些页面并将它们保存到我的服务器上。 我有以下代码(域被隐藏),从文件目录的文本文件列表中进行筛选,…

会傲 2024-08-06 20:02:41 3 0

屏幕抓取应用程序(非 HTML)

I need screen scraper application which will recognize text from the screen (and not use winapi to do this so source could be in image file)…

怎樣才叫好 2024-08-06 18:27:38 2 0

如何抓取网站数据?

因此,我经常检查我的帐户是否有不同的号码。例如,我的联属账户:我检查现金增加情况。 我想编写一个脚本,它可以登录所有这些网站,然后为我获取金…

断肠人 2024-08-06 12:17:55 4 0

如何在 python 中下载具有正确字符集的任何(!)网页?

问题 当使用 python 对网页进行屏幕抓取时,必须知道页面的字符编码。如果字符编码错误,那么输出将会混乱。 人们通常使用一些基本技术来检测编码。它…

ぽ尐不点ル 2024-08-06 02:48:50 7 0

如何防止有人窃取 API feed?

我已经开始开发一个网页,最近雇了一个人编写代码,在 http 的中间面板中显示自定义提要(由 API 提供支持) ://farmball.com/。 请注意,这不是与网…

尘曦 2024-08-05 20:36:31 4 0
更多

推荐作者

留蓝

文章 0 评论 0

18790681156

文章 0 评论 0

zach7772

文章 0 评论 0

Wini

文章 0 评论 0

ayeshaaroy

文章 0 评论 0

初雪

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文