screen-scraping

screen-scraping

文章 0 浏览 5

curl 无法获取网页内容,为什么?

我正在使用curl 脚本转到链接并获取其内容以进行进一步操作。 以下是链接和curl脚本:

烟火散人牵绊 2024-07-18 18:49:11 14 0

如何使用正则表达式从网页中提取数据?

我正在编写一个curl脚本来收集有关一些性犯罪者的信息,我开发了一个脚本来获取如下所示的链接: http://criminaljustice.state.ny.us/cgi/internet/n…

浅紫色的梦幻 2024-07-18 14:23:04 11 0

Python-从 asp.net AJAX 应用程序获取数据

使用Python,我尝试读取 http://utahcritseries.com/RawResults.aspx 上的值。 我可以很好地阅读该页面,但很难更改年份组合框的值以查看其他年份的数…

醉酒的小男人 2024-07-18 14:12:08 9 0

网页抓取选项 - C++ 仅版本

我正在寻找一个好的 C++ 库来进行网页抓取。 它必须是C/C++,没有其他,所以请不要引导我HTML 抓取选项 或其他 SO 问题/答案,其中甚至没有提到 C++。…

野鹿林 2024-07-18 07:34:57 8 0

python-beautifulsoup 误报了我的 html 吗?

据我所知,我每台机器都有两台,运行 python 2.5 和 BeautifulSoup 3.1.0.1。 我正在尝试抓取 http://utahcritseries.com/RawResults.aspx,使用 from…

水水月牙 2024-07-18 04:02:14 11 0

如何使用 Perl 登录 YouTube?

我正在尝试编写一个 Perl 脚本来连接到我的 YouTube 帐户,但它似乎不起作用。 基本上我只想连接到我的帐户,但显然它不起作用。 我什至不知道如何调…

小猫一只 2024-07-18 01:15:08 8 0

卷曲功能可从选择框中选择选项并自动提交

我是一个新手,每天都会尝试不同的事情,当我遇到困难时总是来这里。 我想使用curl和php编写一个脚本,该脚本转到此链接:http:// tools.cisco.com/WW…

定格我的天空 2024-07-17 15:27:05 7 0

最好的屏幕抓取语言是什么?

您好,我想创建一个桌面应用程序(c# 问题)来抓取或操作第 3 方网页上的表单。 基本上,我在桌面应用程序的表单中输入我的数据,它会转到第 3 方网站…

一城柳絮吹成雪 2024-07-17 10:00:57 12 0

如何从屏幕上抓取网络邮件页面?

我正在做一个项目,其中我需要登录网站并抓取网页内容。 我尝试了以下代码: protected void Page_Load(object sender, EventArgs e) { WebClient web…

你好,陌生人 2024-07-16 15:28:50 11 0

截取您一生中见过的最丑陋的 HTML

我正在使用 PHP 和 libtidy 来尝试筛选可能是历史上最可怕、最畸形的 HTML 表格使用情况。 该网站关闭了一些表格、tr、td、字体或粗体标签,并始终在…

恏ㄋ傷疤忘ㄋ疼 2024-07-16 10:06:06 13 0

为 Java 应用程序筛选格式不良的 XHTML 页面的最佳方法是什么

我希望能够从网页中获取内容,尤其是标签及其中的内容。 我尝试过 XQuery 和 XPath,但它们似乎不适用于格式错误的 XHTML,而 REGEX 则很痛苦。 有没…

初心 2024-07-16 06:54:39 11 0

如何在 ASP.NET 中模拟网站登录,然后从页面中抓取一些数据

是否有人对在 ASP.NET 代码中执行以下操作有任何建议: 1) 使用用户名和密码登录受密码保护的站点(目标站点不一定是 ASP.NET) 2) 导航到特定页面和/…

猫七 2024-07-16 05:43:48 7 0

屏幕抓取 ASP.NET 网页以检索网格视图中显示的数据

我正在使用 RUBY 来屏幕截图一个网页(在 asp.net 中创建),该网页使用 gridview 来显示数据。 我能够成功读取网格第 1 页上显示的数据,但无法弄清…

嘿咻 2024-07-15 23:17:12 10 0

为什么 Beautiful Soup 会截断此页面?

我正在尝试从我的学校图书馆订阅的资源列表中提取资源/数据库名称和 ID 列表。 有些页面列出了不同的资源,我可以使用 urllib2 来获取页面,但是当我…

み格子的夏天 2024-07-15 17:29:28 9 0

如何下载雅虎网上论坛?

我想下载一些雅虎群组(文件、照片、消息、成员列表),我找到了这些脚本: http ://freshmeat.net/projects/grabyahoogroup/ http://sourceforge .ne…

伴随着你 2024-07-15 10:44:18 9 0
更多

推荐作者

吝吻

文章 0 评论 0

Jasmine

文章 0 评论 0

∞梦里开花

文章 0 评论 0

阳光①夏

文章 0 评论 0

暮念

文章 0 评论 0

梦里泪两行

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文