webmagic java爬虫获取网页中的超链接时,超链接的地址是不完整的,怎么能获得超链接的完整地址?
如图所示,下获取初始页面的这些超链接中的内容,获取的链接都是 ?p=1 这种,
隐藏的地址怎么加上?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
如图所示,下获取初始页面的这些超链接中的内容,获取的链接都是 ?p=1 这种,
隐藏的地址怎么加上?
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(4)
我想在数字后面拼.html,这个要怎么加上?
使用当前抓取的网页的url作为前缀
是想作为网页添加到爬取网页中的,不知道怎么拼
在其前面用当前url进行拼接就行了~