如何扩展一下用正则来提取?因为链接是在json中。
搞定,结束讨论。
extractAllNodesThatMatch只是把符合的node提取出来。
但所有的json都在一个node中。这样需要后续处理?
并且node类型是个TextNode
不是用来解析json。抓取链接时,有的链接是正常链接。有的页面如sina部分列表页,是json格式。所以想利用正则解析出来。
htmlparser 用来解析 json 吗? 不可以吧
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
暂无简介
文章 0 评论 0
接受
发布评论
评论(6)
引用来自#7楼“曹操”的帖子
搞定,结束讨论。
搞定,结束讨论。
引用来自#5楼“曹操”的帖子
extractAllNodesThatMatch只是把符合的node提取出来。
但所有的json都在一个node中。这样需要后续处理?
extractAllNodesThatMatch只是把符合的node提取出来。
并且node类型是个TextNode
但所有的json都在一个node中。这样需要后续处理?
不是用来解析json。抓取链接时,有的链接是正常链接。有的页面如sina部分列表页,是json格式。所以想利用正则解析出来。
htmlparser 用来解析 json 吗? 不可以吧