urllib爬虫下载图片,很简单的程序,但是输出结果却不定,很奇怪
1.此程序需要第三方模块 bs4 ,请先确保该模块已安装再实验。
2.爬虫网站为【http://tieba.baidu.com/p/2772...】,里面的楼主发了130张手机壁纸
3.问题参见代码里的注释
#-*-coding:utf-8 -*-
from bs4 import BeautifulSoup
import urllib
def getContent(url):
html=urllib.urlopen(url)
content=html.read()
html.close()
return content
info = getContent('http://tieba.baidu.com/p/2772656630')
def getImages(info):
soup=BeautifulSoup(info,'lxml')
all_img=soup.find_all('img',class_='BDE_Image')
num=len(all_img)
x=1
for img in all_img:
print img['src']
image_name="%s.jpg"%x
urllib.urlretrieve(img['src'],image_name)
'''
为什么大部分时候输出是【x=121,num=120】,少数情况是【x=131,num=130】???
'''
x=x+1
print x
print num
getImages(info)
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我實測三次都是 131 130
輸出不定是隨機(一下121 120, 一下 131 130), 還是之前幾次是 121 120, 後來變成 131 130
猜測會不會是因為有新的圖被加上去了
我回答過的問題: Python-QA