使用 HTMLAgilityPack 从节点的子节点中选择所有
我有以下代码用于获取 html 页面。将网址设置为绝对,然后将链接设置为 rel nofollow 并在新窗口/选项卡中打开。我的问题是向 添加属性。 string url …
C# 中的 Web 浏览 - 库、工具等 - 有类似 Perl 中的 Mechanize 的东西吗?
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …
赞普。 PHP脚本显示空白页!
php 脚本调用四个函数来抓取不同网站的数据。 $returnData[0]=getWebsite1Data($description) $returnData[1]=getWebsite2Data($description) $return…
Java 是否有类似于 lxml 或 nokogiri 的库?
Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…
我应该如何使用 HTMLAgilityPack AppendNode?
周五这个阶段真是头疼!我正在尝试使用 InsertAfter() 将 HtmlNode 添加到另一个。当我将其 rpint 到控制台时,我可以看到带有面包屑 id 的 refChild …
使用 python 向 aspx 页面提交查询并抓取结果?
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …
任何用于 ruby 的 html/css 解析库PHP?
我即将完成使用 mechanize&ruby 解析/抓取网站的脚本。 我将来需要将我的脚本移植到 PHP。 我的问题是 是否有任何库可用于 ruby 和 php,或者 …
使用屏幕截图提取数据
Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…
Flickr 自动化适用于 Flickr API 中不可用的操作(例如添加联系人)
编辑:我添加了赏金,如果有人可以帮助我找出我做错了什么,那就全是你的了。 而且,我真的不在乎这是如何完成的。如果有一个库可以提供帮助,或者类…
从 Flash Web 应用程序中导航和抓取内容
我需要一个工具,可以指向基于 Flash 的网站、对其进行导航并检查给定页面上的内容。 我认为仅使用 selenium 无法做到这一点,因为我无法通过 xpath …
如何使用 lxml、XPath 和 Python 从网页中提取链接?
我有这个 xpath 查询: /html/body//tbody/tr[*]/td[*]/a[@title]/@href 它提取带有 title 属性的所有链接 - 并在 href /addon/1095" rel="nofollow n…
使用curl从一个网页转到另一个涉及javascript的网页
我有webpage1.html,它有一个超链接,其href =“some/javascript/function/outputLink()” 现在,使用curl(或php中的任何其他方法)如何推断出超链接…