Java 去除 HTML 标签

发布于 2024-07-03 23:34:38 字数 946 浏览 35 评论 0

/**
 * 过滤 html 标签
 * @param htmlStr
 * @return
 */
public synchronized static String delHTMLTag(String htmlStr){ 
	String regEx_script="<script[^>]*?>[\\s\\S]*?<\\/script>"; //定义 script 的正则表达式 
	String regEx_style="<style[^>]*?>[\\s\\S]*?<\\/style>"; //定义 style 的正则表达式 
	String regEx_html="<[^>]+>"; //定义 HTML 标签的正则表达式 

	Pattern p_script=Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE); 
	Matcher m_script=p_script.matcher(htmlStr); 
	htmlStr=m_script.replaceAll(""); //过滤 script 标签 

	Pattern p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE); 
	Matcher m_style=p_style.matcher(htmlStr); 
	htmlStr=m_style.replaceAll(""); //过滤 style 标签 

	Pattern p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE); 
	Matcher m_html=p_html.matcher(htmlStr); 
	htmlStr=m_html.replaceAll(""); //过滤 html 标签 

	return htmlStr.trim(); //返回文本字符串 
} 

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文