代理功能到底是否好用? .setHttpProxy(new HttpHost("",)) 该方法是否可用?
@黄亿华 你好,想跟你请教个问题:代理功能到底是否好用? .setHttpProxy(new HttpHost("",)) 该方法是否可用? …
使用webmagic遇到的问题及解决办法
      感谢黄大写的垂直爬虫框架webmagic,简化了我的工作,少些了很多代码.这里对使用过程中遇到的问题,已经如何解决的,做一些汇总和梳理…
使用WebMagic采集的一个问题
我正在使用WebMagic采集zhihu的时候发现一个问题. zhihu.com使用到了CDN技术,我使用WebMagic调试中发现了SSL握手过程中返回给我的证书,并非是zhihu.c…
webmagic运行提示错误
运行 这个错误时咋回事 调用Site.me().addStartUrl("http://my.oschina.net/flashsword/blog").setDomain("my.oschina.net")貌似报错Exception i…
webmagic下载出现中文乱码
@黄亿华 你好,想跟你请教个问题:我运行了您写的那个webmagic-core包中的示例程序,从开源中国博客上下载下来的中文内容通过FilePipeline方法保存到…
抓取不到新浪微博的网页
以下是page.tostring(),可是查看浏览器源码差太多了 Page{request=Request{url='http://weibo.com/rjfittime?from=feed&loc=at&nick=FitTimeç…