C++ 的网络抓取工具类似于 Perl 的 WWW::Mechanize?
我想知道是否有类似于 Perl 的 WWW::Mechanize 的 C++ 网络抓取库/API?我不仅在寻找 HTML 解析本身,而且还支持有状态 HTTP 浏览、Web 表单提交以及维护和使用 cookie,例如创建 Web 机器人。
I would like to know if there is a web-scraping library/API for C++ similar to Perl's WWW::Mechanize? I'm not only looking for HTML parsing itself, but also support for stateful HTTP browsing, submission of Web forms, and maintaining and using cookies, for example to make a Web bot.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
对于 Web 自动化来说,瓶颈是 I/O 而不是 CPU,这意味着使用 C++ 这样的语言没有意义。大多数此类库都是使用 Perl、Python 等高级语言开发的。
您可以 在 C++ 程序中使用 Perl,因此只需使用原始 Perl 库即可。
For web automation the bottleneck is I/O rather than CPU, which means it doesn't make sense to use a language like C++. Most of these kind of libraries are developed with higher level languages like Perl, Python, etc.
You can use Perl in a C++ program so just use the original Perl library.