java正则问题处理html字符串img标签不处理其它在 " 符号前面加上转义符号,请帮忙谢谢

发布于 2022-09-01 19:06:51 字数 523 浏览 12 评论 0

如下html字符串:

<!DOCTYPE HTML>
<html>
<head>
<meta charset="UTF-8" /> 
<style type="text/css"></style>
<img src="123.jpg" />
<div>
<img src="456.jpg" />
</div>
</html>

处理完如下:

<!DOCTYPE HTML>
<html>
<head>
<meta charset=\"UTF-8\" /> 
<style type=\"text/css\"></style>
<img src="123.jpg" />
<div>
<img src="456.jpg" />
</div>
</html>

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

倦话 2022-09-08 19:06:51

想了想,要是直接把所有不属于img的引号找到比较困难,但是可以先把img的字符串整体先提取出来并保存,替换成特殊字符串,然后再去找到所有的引号,替换成\",之后再把保存的img字符串替换回来。

    Pattern pattern=Pattern.compile("<img src=.+>");
    String str="你的字符串";
    Matcher matcher=pattern.matcher(str);
    List<String> strList=new ArrayList<String>();
    while(matcher.find()){
        strList.add(matcher.group());//将带引号的img标签保存下来
    }
    str=matcher.replaceAll("<img>");//将所有的带引号img标签替换成<img>

    Pattern pat=Pattern.compile("\"");
    Matcher mat=pat.matcher(str);
    str=mat.replaceAll("\\\\\"");//将剩下的引号替换为\";

    Pattern p=Pattern.compile("<img>");
    Matcher m=p.matcher(str);
    int i=0;
    while(m.find()){
        str=m.replaceFirst(strList.get(i));//将带引号的img标签再替换回来
        i++;
    }
    System.out.println(str);
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文