screen-scraping

screen-scraping

文章 0 浏览 3

获取列表的最快方法 来自本地主机网站上所有页面的值

我本质上是想抓取我的本地站点并创建所有标题和 URL 的列表,如下所示: http://localhost/mySite/Default.aspx My Home Page http://localhost/mySit…

眸中客 2024-07-09 02:54:09 4 0

PHP CSS 选择器库?

是否有 PHP 类/库允许我使用 CSS 选择器查询 XHTML 文档? 如果我能以某种方式使用 CSS 选择器(jQuery 宠坏了我!),我需要抓取一些页面来获取非常…

栖竹 2024-07-08 20:14:32 5 0

如何扫描网页并获取图像和 YouTube 嵌入?

我正在构建一个网络应用程序,我需要获取给定 URL 上嵌入的所有图像和任何 Flash 视频(例如 youtube)。 我正在使用Python。 我已经用谷歌搜索过,但…

是你 2024-07-08 17:07:53 6 0

无法从本地主机通过 cURL 访问网站,但可以从托管服务器访问网站

我正在编写一个脚本,使用 PHP 5 和 cURL 从 wowarmory.com 提取 XML 数据: $url = "http://www.wowarmory.com" $userAgent = 'Mozilla/5.0 (Windows…

天气好吗我好吗 2024-07-08 07:29:42 3 0

如何将 HTML 表格抓取为 CSV?

问题 我在工作中使用一个工具,可以让我进行查询并获取 HTML 信息表。 我没有任何后端访问权限。 这些信息将会更加有用。如何将这些数据通过屏幕抓取…

南…巷孤猫 2024-07-07 23:19:23 5 0

Perl:从经过身份验证的网站抓取 HTML

虽然从我所看到的情况来看,HTML 抓取有相当详细的记录,并且我了解它的概念和实现,但是从隐藏在身份验证表单后面的内容中抓取的最佳方法是什么。 我…

无语# 2024-07-07 14:52:26 7 0

抓取动态网站

抓取大部分内容都是由 ajax 请求生成的动态网站的最佳方法是什么? 我之前有过使用 Mechanize、BeautifulSoup 和 python 组合的经验,但我准备尝试一…

灵芸 2024-07-07 13:06:12 5 0

使用 C# 读取和发布到网页

我的工作项目要求我能够在网页中输入信息,阅读重定向到的下一页,然后采取进一步的操作。 一个简化的现实示例类似于访问 google.com,输入“编码技巧…

半边脸i 2024-07-06 16:03:40 6 0

屏幕抓取工具如何工作?

Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进这个问题?通过编辑这篇文章来更新问题,使其仅…

慕巷 2024-07-06 15:10:45 8 0

使用 .net 托管代码屏幕抓取命令窗口

我正在 dot net 中编写一个程序,它将使用框架 2.0 的 Process 对象执行脚本和命令行程序。 我希望能够访问程序中进程的屏幕缓冲区。 我已经对此进行…

硬不硬你别怂 2024-07-05 22:40:59 4 0

如何在安全站点中使用网络客户端?

我需要自动化涉及使用登录表单的网站的流程。 我需要捕获登录页面后面的页面中的一些数据。 我知道如何从屏幕上抓取普通页面,但不知道如何抓取安全网…

染火枫林 2024-07-05 16:17:31 4 0

将 RSS 添加到任何网站?

是否有任何网站/服务可以让我向任何网站添加 RSS 订阅? 这是我工作的公司。 我们有一个网站,显示公司相关新闻。 这些新闻由外部机构提供,并自动更…

回忆追雨的时光 2024-07-05 02:32:40 3 0

如何保存包含所有媒体的公共 html 页面并保留结构

正在寻找一个 Linux 应用程序(或 Firefox 扩展),它可以让我抓取 HTML 模型并保持页面的完整性。 Firefox 做得几乎完美,但没有抓取 CSS 中引用的图…

梦与时光遇 2024-07-04 20:00:44 6 0

如何在 Java 中获取 HTML

在不使用任何外部库的情况下,将网站的 HTML 内容提取到字符串中的最简单方法是什么?…

岁月流歌 2024-07-04 15:25:16 6 0

从登录后的页面获取 HTML

这个问题是我的上一个问题关于从 ASPX 页面获取 HTML 的后续问题。 我决定尝试使用 webclient 对象,但问题是我获取了登录页面的 HTML,因为需要登录…

骑趴 2024-07-04 10:07:32 5 0
更多

推荐作者

yangzhenyu123

文章 0 评论 0

lvzun

文章 0 评论 0

执笔绘流年

文章 0 评论 0

芯好空

文章 0 评论 0

始于初秋

文章 0 评论 0

谁与争疯

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文