爬虫获得了如图内容,现在需要取出该字符串中的四组汉字,用了包含的正则方法(.*),没有成功,请问如何取出,或者说有更好的方法。
经过一段时间的研究,我发现可以通过正则获取所有的汉字,然后把提取列表变为字符串,然后使用结巴分词分开即可。
这是 JSON 啊,直接解析了按结构取不就完了……
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
暂无简介
文章 0 评论 0
接受
经过一段时间的研究,我发现可以通过正则获取所有的汉字,然后把提取列表变为字符串,然后使用结巴分词分开即可。