java怎么用正则表达式提取出html代码中的图片url
题目描述
要把以前文章中的外部链接的图片缓存下来再替换成自己内部的地址,一条数据的html带着很多图片,想用正则匹配一下,搞的头大,求助大佬。
主要有三种要正则匹配出的图片
①<img src='https://image2.135editor.com/cache/remote/aHR0cHM6Ly9tbWJpei5xbG9nby5jbi9tbWJpel9qcGcvY1pWMmhScHVBUGpYZG56aWJxV1hGOUFIbHRxMU1BODhPblY2ZldrWjltZGJWQ0V2QlYxWWFKS1JGYU9TUTc1STV6SUlDdGIycnFIUG1EbHJIZ3BCMmZBLzA/d3hfZm10PWpwZWc=' />
②<section background-image: url("https://image2.135editor.com/cache/remote/aHR0cHM6Ly9tbWJpei5xbG9nby5jbi9tbWJpel9qcGcvY1pWMmhScHVBUGpYZG56aWJxV1hGOUFIbHRxMU1BODhPblY2ZldrWjltZGJWQ0V2QlYxWWFKS1JGYU9TUTc1STV6SUlDdGIycnFIUG1EbHJIZ3BCMmZBLzA/d3hfZm10PWpwZWc=") />
②<section -webkit-border-image: url("https://image2.135editor.com/cache/remote/aHR0cHM6Ly9tbWJpei5xbG9nby5jbi9tbWJpel9qcGcvY1pWMmhScHVBUGpYZG56aWJxV1hGOUFIbHRxMU1BODhPblY2ZldrWjltZGJWQ0V2QlYxWWFKS1JGYU9TUTc1STV6SUlDdGIycnFIUG1EbHJIZ3BCMmZBLzA/d3hfZm10PWpwZWc=") />
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
不会java ,用python的re写的,应该差不多。
如果就是这个数据的话,可以这么写试一试
f = open('a.txt').read()
re.findall("(https://image[^;']+)",f)
贴一下代码,正则还是差点意思,
"
"
还是给提取出来了,加段代码再判断一下算是能用。。