如何取出79?
a:containsOwn('79'),没用过,但是我看文档里面好像有这个方法你看看行不行,遇到问题,不要急着问人,先自己找资料,这样的学习方式比较好
看你的想法是取得页数最大值,然后循环抓取所有网页,没有特别好的方法Document doc = Jsoup.parse(result);doc.getElementsByTag("a");for(Element link : elements){if(link.text().trim().equals("末页")){String href = link.attr("href"); Integer.parseInt()//获取到/a/list_1_79.html 然后在用subString处理下,最后用Integer.parseInt()转下}}获取到/a/list_1_79.html 然后在用subString处理下,最后用Integer.parseInt()转下
当然这样遍历效率稍微低点,你也可以用document.select 先获取翻页标签所在的div然后在处理
看你抓取的这个网站就知道你也是个同道中人,当年我也做过httpclient+jsoup 抓取美图~继续努力吧
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
有一天你能到我的心里去,你会看到那里全是你给的伤悲。
文章 0 评论 0
接受
发布评论
评论(2)
a:containsOwn('79'),没用过,但是我看文档里面好像有这个方法
你看看行不行,遇到问题,不要急着问人,先自己找资料,这样的学习方式比较好
看你的想法是取得页数最大值,然后循环抓取所有网页,没有特别好的方法
Document doc = Jsoup.parse(result);
doc.getElementsByTag("a");
for(Element link : elements){
if(link.text().trim().equals("末页")){
String href = link.attr("href"); Integer.parseInt()
//获取到/a/list_1_79.html 然后在用subString处理下,最后用Integer.parseInt()转下
}
}
获取到/a/list_1_79.html 然后在用subString处理下,最后用Integer.parseInt()转下
当然这样遍历效率稍微低点,你也可以用
document.select 先获取翻页标签所在的div然后在处理
看你抓取的这个网站就知道你也是个同道中人,当年我也做过httpclient+jsoup 抓取美图~
继续努力吧