webmagic在输出的时候顺序为什么和putfield的顺序不一样
@黄亿华 你好,想跟你请教个问题:webmagic在输出的时候顺序为什么和putfield的顺序不一样,比如我依次压入title,name,lon,lat四个值,但是consolepi…
SeleniumDownloader 遇到点问题
@黄亿华 你好,想跟你请教个问题: Spider spider = new Spider(new OschinaBlogPageProcesser()); spider.addUrl("http://my.oschina.net/flashswor…
怎么写抓取的 html 特征节点
@黄亿华 你好,想跟你请教个问题: page.putField("intro",page.getHtml().xpath("//div[@class='left_648 top_border']/div[... 要得到图中的文字,…
请教webmagic SeleniumDownloader数据保存问题
@黄亿华 你好,想跟你请教个问题: 我想爬取一个网站,是瀑布流的,现在下载了webmagic,copy了你写的花瓣雨例子运行,代码如下: import us.codecra…
code error 403
請求這是為什麽? FilePipeline filePipeline = new FilePipeline("F://webmagic//"); Spider.create( new SimplePageProcessor("ht…
webmagic 如何使用xpath获取 <a>的内部值
@黄亿华 刚开始接触爬虫,请教一个简单的问题:在使用webmagic 时 page.putField("title", page.getHtml().xpath("/html/body/table[5]/tbody/tr[5]/…
请教HttpClientDownloader类的问题
@黄亿华 黄大,今天在用webmagic时,仔细读了一下HttpClientDownloader源码,发现通过Site#addCookie()设置的cookie在HttpClientDownloader中没有用…