C#爬虫:html中script标签的解析
c# 控制台程序写的一个爬虫。
爬虫遇到JS代码时,尤其是像新浪博客中的翻页,其“下一页”的链接是隐藏在JS代码中的,这是需要对Script标签进行解析。
看了一下V8和SpiderMonkey,不过资料比较少,不知道怎么用。
HTML解析器HtmlParser也看了一下,不知道能不能对script标签进行解析,如果可以,怎么做?
请各位大神不吝赐教,感激不尽!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
找个script引擎库
找个script引擎库