screen-scraping

screen-scraping

文章 0 浏览 5

将 Salesforce VisualForce 页面视为外部小部件

我想将 Salesforce VisualForce 页面变成我公司网站的小部件。我想使用服务器端代码和服务帐户访问小部件。我将在我的网页中缓存、设置样式并输出小部…

时光磨忆 2024-12-11 14:40:33 0 0

使用 Node.js 进行网页抓取时,我可以在页面上运行所有 JavaScript 吗? (即模拟真实的浏览器?)

我正在尝试使用 Node.js 进行一些网络抓取。使用jsdom,可以轻松加载 DOM 并将 JavaScript 注入其中。我想更进一步:运行从网页链接到的所有 JavaScri…

作死小能手 2024-12-10 23:53:20 1 0

通过 nokogiri 或 hpricot 进行屏幕抓取

我正在尝试获取给定 xpath 的实际值。我在sample.rb 文件中有以下代码 require 'rubygems' require 'nokogiri' require 'open-uri' doc = Nokogiri::H…

醉城メ夜风 2024-12-10 20:43:58 0 0

preg_match 与 '.jpg' 不准确图案

我使用 preg_match 和模式 $pattern = '/src="http:\/\/(.*?).jpg"/s'; 来获取网址网页上的 jpeg 图像。但是,这不够准确,因为它还抓取 http://www.d…

独夜无伴 2024-12-10 19:51:49 1 0

如何使用Enlive从指定标签中抓取数据?

有人可以解释一下如何从 标签中抓取内容,其中 具有内容值(实际上在这种情况下我需要 标签用于匹配操作)“Row1 标题”,但在处理过程中没有抓取 标…

┊风居住的梦幻卍 2024-12-10 13:05:03 0 0

Python - 屏幕抓取 Yahoo!梦幻足球游戏频道

所以我正在尝试抓取雅虎游戏频道/startracker,这样我就可以在玩家获得积分时获取幻想队的更新,这样我就可以在Excel中制作图表。网站网址基本上是 ht…

明天过后 2024-12-10 12:37:53 0 0

Foreach DOM 解析器

有谁知道为什么这行不通? foreach($html->find('tbody.result') as $article) { // get retail $item['Retail'] = trim($article->find('span.price'…

他是夢罘是命 2024-12-10 03:37:27 1 0

需要帮助来构建“机器人”从 HTTP 请求中提取数据

我正在使用 ASP.net 和 C# 构建一个网站,其组件之一涉及代表用户登录用户拥有帐户的网站(例如移动电话公司),从该网站获取信息并存储它在我们的数…

一城柳絮吹成雪 2024-12-09 20:33:49 0 0

HtmlUnit iframe 与 javascript src

我正在尝试抓取 Google 关键字工具,但遇到了带有 javascript src 的 iframe 的问题。我以为 HtmlUnit 会自动处理这个问题,但是没有。我在谷歌上搜索…

缱绻入梦 2024-12-09 18:05:41 0 0

从 What.cd 检索页面

我正在使用 BeautifulSoup for What.cd 使用 Python 开发屏幕抓取工具。我在工作时遇到了这个脚本并决定看看它,因为它看起来与我正在做的事情相似。…

意犹 2024-12-09 12:00:35 1 0

简化代码以加速 php scraper

代码只需浸入页面并从指定表中获取所有表内容,将其插入到我的数据库中并回显它。 它做得非常慢我需要一些想法来简化它以更快地工作

情绪少女 2024-12-09 01:15:04 1 0

使用 python 机器人解析器

我不明白如何使用 robotsparser 模块中的解析函数。这是我尝试过的: In [28]: rp.set_url("http://anilattech.wordpress.com/robots.txt") In [29]: …

九命猫 2024-12-08 09:43:58 1 0

Python 屏幕抓取整个网站

我想制作一个小程序,它将使用任何网站上的每一个具有某种意义的单词 它应该是用Python编写的,我听说过BeautifulSoup,但我不太知道如何使用它来达到…

一张白纸 2024-12-07 14:39:16 0 0

Node.js:代理站点如何处理相对 URL?

我在 Node 中创建了一个相对简单的代理,它允许我下载页面并显示它们。这很好,尽管一些脚本、链接、表单和图像似乎已损坏,因为它们指向相关文件。作…

无尽的现实 2024-12-06 08:38:11 0 0

屏幕抓取

Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找书籍、工具、软件库…

灼疼热情 2024-12-05 18:10:09 0 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文