screen-scraping

screen-scraping

文章 0 浏览 4

程序化表单提交

我想抓取网页的内容。 内容是在该网站上填写并提交表格后生成的。 我已经阅读了如何抓取最终结果内容/网页 - 但如何以编程方式提交表单? 我正在使用 …

清旖 2024-07-10 11:10:53 9 0

如何保护/监控您的网站免遭恶意用户抓取

情况: 网站的内容受用户名/密码保护(并非全部受控,因为他们可以是试用/测试用户), 由于用户名/密码限制,普通搜索引擎无法访问该网站, 恶意用户…

暖心男生 2024-07-10 06:50:59 8 0

使用 PHP 进行抓取 SimpleXML...我可以抓取图像但不能抓取原始文本?

我正在尝试从网站上获取特定的原始文本。 通过这个网站和其他来源,我学会了如何使用 simpleXML 和 xpath 抓取特定图像。 然而,同样的方法似乎不适用…

定格我的天空 2024-07-10 06:34:07 4 0

识别网页上物理地址的算法

识别 HTML 页面上的结构化数据的最佳算法是什么? 例如,谷歌将识别电子邮件中的家庭/公司地址,并提供该地址的地图。…

你与清晨阳光 2024-07-09 14:35:30 9 0

如何将 cookie 传递到外部 Web 浏览器?

我正在编写一个应用程序,需要打开浏览器窗口(可能只能使用 IE)来访问使用表单身份验证的网站。 诀窍在于,它们需要经过身份验证,以便节省时间,因…

廻憶裏菂餘溫 2024-07-09 03:13:32 7 0

获取列表的最快方法 来自本地主机网站上所有页面的值

我本质上是想抓取我的本地站点并创建所有标题和 URL 的列表,如下所示: http://localhost/mySite/Default.aspx My Home Page http://localhost/mySit…

眸中客 2024-07-09 02:54:09 6 0

PHP CSS 选择器库?

是否有 PHP 类/库允许我使用 CSS 选择器查询 XHTML 文档? 如果我能以某种方式使用 CSS 选择器(jQuery 宠坏了我!),我需要抓取一些页面来获取非常…

栖竹 2024-07-08 20:14:32 8 0

如何扫描网页并获取图像和 YouTube 嵌入?

我正在构建一个网络应用程序,我需要获取给定 URL 上嵌入的所有图像和任何 Flash 视频(例如 youtube)。 我正在使用Python。 我已经用谷歌搜索过,但…

是你 2024-07-08 17:07:53 8 0

无法从本地主机通过 cURL 访问网站,但可以从托管服务器访问网站

我正在编写一个脚本,使用 PHP 5 和 cURL 从 wowarmory.com 提取 XML 数据: $url = "http://www.wowarmory.com" $userAgent = 'Mozilla/5.0 (Windows…

天气好吗我好吗 2024-07-08 07:29:42 6 0

如何将 HTML 表格抓取为 CSV?

问题 我在工作中使用一个工具,可以让我进行查询并获取 HTML 信息表。 我没有任何后端访问权限。 这些信息将会更加有用。如何将这些数据通过屏幕抓取…

南…巷孤猫 2024-07-07 23:19:23 7 0

Perl:从经过身份验证的网站抓取 HTML

虽然从我所看到的情况来看,HTML 抓取有相当详细的记录,并且我了解它的概念和实现,但是从隐藏在身份验证表单后面的内容中抓取的最佳方法是什么。 我…

无语# 2024-07-07 14:52:26 9 0

抓取动态网站

抓取大部分内容都是由 ajax 请求生成的动态网站的最佳方法是什么? 我之前有过使用 Mechanize、BeautifulSoup 和 python 组合的经验,但我准备尝试一…

灵芸 2024-07-07 13:06:12 7 0

使用 C# 读取和发布到网页

我的工作项目要求我能够在网页中输入信息,阅读重定向到的下一页,然后采取进一步的操作。 一个简化的现实示例类似于访问 google.com,输入“编码技巧…

半边脸i 2024-07-06 16:03:40 8 0

屏幕抓取工具如何工作?

Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进这个问题?通过编辑这篇文章来更新问题,使其仅…

慕巷 2024-07-06 15:10:45 10 0

使用 .net 托管代码屏幕抓取命令窗口

我正在 dot net 中编写一个程序,它将使用框架 2.0 的 Process 对象执行脚本和命令行程序。 我希望能够访问程序中进程的屏幕缓冲区。 我已经对此进行…

硬不硬你别怂 2024-07-05 22:40:59 7 0
更多

推荐作者

linfzu01

文章 0 评论 0

可遇━不可求

文章 0 评论 0

枕梦

文章 0 评论 0

qq_3LFa8Q

文章 0 评论 0

JP

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文