请问,下图这样的地址中的图片怎样抓取并将图片保存到本地呢?
随便哪个语言,解析出图片地址,然后get请求到图片,保存!
首先获取到图片的地址,然后通过发送http请求,获取到对应的响应结果,一般以流的形式保存到一个文件中,文件的名称就是图片中地址的名称,有一点需要注意的是图片的格式,通过文件头标识判断图片格式【总结】
补充一点啊,图片的地址在data-src中,这个应该是用js实现的动态图片加载,刚请求到页面的时候src为空,或者是一张gif之类的小图片,然后js去分别读取data-src的值,赋给src实现的,所以去data-src找图片url
以java为例子,可以使用jsoup爬取页面,通过select方法获取img标签,获取src属性值,得到图片路径,通过网络请求下载图片,因为部分图片对站外引用进行了屏蔽,所以可能需要在请求访问属性添加Referer和User-Agent,保证请求的一致性。
其他语言也相同,通过任意方式获取页面上img标签的src属性值,然后通过网络请求将其下载
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
暂无简介
文章 0 评论 0
接受
发布评论
评论(4)
随便哪个语言,解析出图片地址,然后get请求到图片,保存!
首先获取到图片的地址,然后通过发送http请求,获取到对应的响应结果,一般以流的形式保存到一个文件中,文件的名称就是图片中地址的名称,有一点需要注意的是图片的格式,通过文件头标识判断图片格式【总结】
补充一点啊,图片的地址在data-src中,这个应该是用js实现的动态图片加载,刚请求到页面的时候src为空,或者是一张gif之类的小图片,然后js去分别读取data-src的值,赋给src实现的,所以去data-src找图片url
以java为例子,可以使用jsoup爬取页面,通过select方法获取img标签,获取src属性值,得到图片路径,通过网络请求下载图片,因为部分图片对站外引用进行了屏蔽,所以可能需要在请求访问属性添加Referer和User-Agent,保证请求的一致性。
其他语言也相同,通过任意方式获取页面上img标签的src属性值,然后通过网络请求将其下载