screen-scraping

screen-scraping

文章 0 浏览 4

从博客和其他网页中智能提取标签

我不是在谈论 HTML 标签,而是用于描述本网站上的博客文章、YouTube 视频或问题的标签。 如果我只抓取一个网站,我只需使用 xpath 来提取标签,甚至使…

眉目亦如画i 2024-09-17 20:17:00 6 0

屏幕抓取一个阻止 ip 的网站

你好,我想屏幕抓取像 yelp 这样的网站来获取意大利餐馆的电话号码。我创建了一个简单的程序来执行我想要的操作,但他们阻止了我的服务器 IP, 我正在…

梨涡 2024-09-17 00:44:19 7 0

需要从多个站点获取div的内容

我想获取 newegg 的产品价格。这是此网站的一个示例网站 http://www.newegg.com/Product/Product.aspx?Item=**N82E16820167027** ,我想获取包含价格…

‖放下 2024-09-16 20:28:59 2 0

使用 grep 从本地文件中的 HTML 标记内获取文本

可能的重复: RegEx 匹配开放标记(XHTML 自包含标记除外) 输入文件摘录 &ltTD class="clsTDLabelWeb" width="28%"&gtMunicipality:&ampnbsp&lt/TD&…

眼眸里的快感 2024-09-16 13:06:41 4 0

抓取和解析域的谷歌数据,例如页面排名等

我需要抓取/解析给定域名(站点)的一些搜索引擎相关数据。 我需要 Google Page Rank(仅针对域名,而不是每个页面)。 索引结果/页面的数量(google…

凌乱心跳 2024-09-16 12:48:31 5 0

解析 XML/“屏幕抓取”的最佳方法是什么?在 iOS 中? UIWebview 还是 NSXMLParser?

我正在创建一个 iOS 应用程序,需要从网页获取一些数据。我的第一个想法是使用 NSXMLParser initWithContentsOfURL: 并使用 NSXMLParser 委托解析 HTM…

彻夜缠绵 2024-09-15 10:52:46 5 0

Scrapy网络爬虫无法抓取链接

我对 Scrapy 很陌生。我的蜘蛛在这里爬行扭曲的网络。 class TwistedWebSpider(BaseSpider): name = "twistedweb3" allowed_domains = ["twistedmatri…

旧情勿念 2024-09-15 04:20:17 6 0

LXml Xpath处理多行字段

我正在对页面进行一些抓取,并且可以很好地获取大多数字段,但地址存在一些问题。 &ltaddress&gt 56 South Ave &ltbr&gt Miami, FL 33131 &ltbr&gt &l…

窝囊感情。 2024-09-14 06:24:58 3 0

如何使用 php 和curl 导入 facebook 联系人

我想创建一个联系人导入器应用程序。如何使用 php 和curl 导入 facebook 联系人(更喜欢屏幕抓取)。请任何人都可以帮助我....…

风月客 2024-09-14 04:04:45 2 0

OpenGL/D3D:如何获取在 Windows 中全屏运行的游戏的屏幕截图?

假设我有一个全屏运行的 OpenGL 游戏(Left 4 Dead 2)。我想以编程方式获取它的屏幕截图,然后将其写入视频文件。 我尝试过 GDI、D3D 和 OpenGL 方法…

記柔刀 2024-09-14 02:06:58 1 0

印度铁路列车搜索 API

Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …

冷情妓 2024-09-14 00:33:09 5 0

StreamReader 上的 C# RegEx 将不会返回匹配项

我正在为自己编写一个简单的屏幕抓取应用程序来使用 HTMLAgilityPack 库,在让它在几种不同类型的 HtmlNode 上工作后,我想我会喜欢并为电子邮件地址…

深居我梦 2024-09-13 12:26:18 0 0

从 Facebook 页面墙或群组墙获取数据以在个人网站上使用

我想连接到公共 Facebook 页面或群组,并在个人网站上列出墙上的所有条目。我将在我的服务器上使用 PHP,所以这对我来说是最好的解决方案。或者 JavaS…

〆凄凉。 2024-09-13 05:52:31 4 0

捕获ajax请求

我想捕获一个 ajax http 请求,并发送所有它的 headers/cookies/post params 来保存它,以便我稍后可以抓取它。 我找不到使用 Firefox 或 Chrome 执行…

ゞ记忆︶ㄣ 2024-09-12 11:43:15 5 0

如何查找“宽字符”由 perl 打印?

从网站抓取静态 html 页面并将其写入单个文件的 Perl 脚本似乎可以工作,但也会在 ./script.pl 第 n 行的 print 中打印许多宽字符实例到控制台:一个…

掀纱窥君容 2024-09-12 04:53:48 2 0
更多

推荐作者

烙印

文章 0 评论 0

singlesman

文章 0 评论 0

独孤求败

文章 0 评论 0

晨钟暮鼓

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文