screen-scraping

screen-scraping

文章 0 浏览 3

如何将基于网络的计算器变成可调用的程序?

我想从 C# 程序访问网页上有一个免费的在线计算器。该计算器非常简单——只是一个 HTML 表格。没有 JavaScript 或 Flash。我希望能够将此页面变成我可…

最初的梦 2024-09-11 04:36:45 1 0

通过 PHP 发送浏览器标头

如何将标头发送到网站,就像 PHP / Apache 是浏览器一样?我正在尝试抓取一个网站,但如果它来自另一台服务器,他们似乎会发送 404 错误... 或者,如…

心安伴我暖 2024-09-11 02:05:41 2 0

使用简单的 HTML DOM 将相对 URL 转换为绝对 URL?

当我从某些页面抓取内容时,脚本会给出一个相对 URL。是否可以使用简单的 HTML DOM 获取绝对 URL?…

放低过去 2024-09-10 23:57:02 0 0

使用 Python 检索类似 Facebook 的链接摘要(标题、摘要、相关图像)

我想复制 Facebook 用于解析链接的功能。当您提交指向 Facebook 状态的链接时,他们的系统会检索建议的标题、摘要以及通常一个或多个相关的图像从该页…

层林尽染 2024-09-10 22:41:03 1 0

Python 解析:lxml 仅获取标签文本的一部分

我正在使用 Python 和 HTML 进行工作,如下所示。我正在使用 lxml 进行解析,但同样可以愉快地使用 pyquery: &ltp&gt&ltspan class="Title"&gtName&l…

听不够的曲调 2024-09-10 16:17:23 2 0

IronRuby 使用 WebClient 下载文件“没有足够的存储空间来处理此命令”

在 IronRuby 交互式控制台的交互式窗口中输入以下两行。 wc = System::Net::WebClient.new doc = wc.DownloadString("http://yahoo.com") 我收到以下…

没有你我更好 2024-09-10 13:10:01 4 0

帮助解决奇怪的 Python 抓取错误。一台机器在其他机器上运行时出现 HTTPError

我正在使用代理,以下是代码。 20 req = urllib2.Request(url) 21 # run the request for each proxy 22 # now set the proxy 23 req.set_proxy(proxy…

故事灯 2024-09-10 12:54:12 1 0

如何捕获屏幕的一部分

我正在使用 win32 PrintWindow 函数将屏幕捕获到 BitMap 对象。 如果我只想捕获窗口的一个区域,如何裁剪内存中的图像? 这是我用来捕获整个窗口的代…

你的往事 2024-09-10 09:26:00 1 0

分析和可用性软件如何做到这一点?

我使用分析软件已经有一段时间了,我一直在问自己,这样的软件如何完全复制网页,然后将其放入 iframe 中,并用图像和信息覆盖它。 示例: 我遇到的一…

牵你的手,一向走下去 2024-09-10 07:38:39 3 0

在php中回显带有标签的图像url

我之前问过一个关于如何从 html 页面回显图像 url 的问题。我可以成功地做到这一点,但如何进一步缩小范围,以便只显示以某个短语开头的图像网址,此…

为你鎻心 2024-09-10 06:59:08 2 0

PHP 中图像链接的屏幕抓取

我有一个网站,其中包含许多不同的产品页面,每个页面都有一定数量的所有页面上格式相同的图像。我希望能够截取每个页面的 url,以便我可以从每个页面…

菊凝晚露 2024-09-10 06:56:28 0 0

MSHTML COM 单击提交按钮时出现问题

我在使用 MSHTML COM 从此网站截屏某些数据时遇到问题成分。我的 WPF 表单上有一个 WebBrowser 控件。 我检索 HMTL 元素的代码位于 WebBrowser LoadCo…

水晶透心 2024-09-10 06:24:52 0 0

我可以使用 Hpricot 查找任何/大多数网站的主要文章文本吗?

Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进此问题?通过编辑这篇文章来更新问题,使其仅关…

泛滥成性 2024-09-10 00:48:57 0 0

编辑 html 页面并重新显示 PHP

因此,我一直在使用一种方法从网站检索图像,但我认为简单地显示页面而不显示一些我不想显示的详细信息可能会更容易。该网站特别知道我们正在这样做,…

忘东忘西忘不掉你 2024-09-09 20:17:45 2 0

匹配所有“http”仅限没有附加字符的 URL

我尝试过下面的表达方式。 (http:\/\/.*?)['\"\&lt \&gt] (http:\/\/[-a-zA-Z0-9+&amp@#\/%?=~_|!:,.\"]*[-a-zA-Z0-9+&amp@#\/%=~_|\"]) 第一个做得很…

余厌 2024-09-09 10:21:23 1 0
更多

推荐作者

lioqio

文章 0 评论 0

Single

文章 0 评论 0

禾厶谷欠

文章 0 评论 0

alipaysp_2zg8elfGgC

文章 0 评论 0

qq_N6d4X7

文章 0 评论 0

放低过去

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文