Perl 网络爬虫如何跟踪 ASP.NET 回发?
我正在 Perl/LWP 中构建一个网络爬虫。 网络爬虫如何跟踪 ASP.NET 网格中的链接,如下所示:
<a id="ctl00_MainContent_listResult_Top_LnkNextPage" href="javascript:__doPostBack('ctl00$MainContent$listResult$Top$LnkNextPage','')">Next</a>
I'm building a webcrawler in Perl/LWP. How can the webcrawler follow a link in a ASP.NET grid like this:
<a id="ctl00_MainContent_listResult_Top_LnkNextPage" href="javascript:__doPostBack('ctl00$MainContent$listResult$Top$LnkNextPage','')">Next</a>
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
看起来有一个名为 WWW::Scripter 的 WWW::Mechanize 子类,其中 javascript 和 ajax 插件应该能够做到这一点。 还没有尝试过那种特殊的方法。
另一种选择是 WWW::Selenium,效果很好,但可能太多了为您提供开销/设置。
Looks like there's a WWW::Mechanize subclass called WWW::Scripter with javascript and ajax plugins that should be able to do this. Haven't tried that particular approach.
The other alternative is WWW::Selenium, which works great but may be too much overhead/setup for you.
请参阅 CPAN 模块 HTML::TreeBuilderX::ASP_NET。
See CPAN module HTML::TreeBuilderX::ASP_NET.
使用 WWW-Mechanize-Firefox,它能够检索/跟踪 Firefox 可以的任何链接。
您需要将 mozrepl 插件安装到 Firefox,perl 模块将连接到该插件并使用 Firefox 打开链接。
http://metacpan.org/pod/WWW::Mechanize::Firefox
示例: http://metacpan.org/pod/WWW ::Mechanize::Firefox::示例
Use WWW-Mechanize-Firefox, it is able to retrieve/follow any links that Firefox could.
You need to install mozrepl addon to firefox and the perl module will be connect to that addon and use firefox to open the links.
http://metacpan.org/pod/WWW::Mechanize::Firefox
Examples: http://metacpan.org/pod/WWW::Mechanize::Firefox::Examples