去掉 HTML 标签?
如何剥离此文本,
<html>
<body>
<h1>My First Heading</h1>
<p>My first paragraph.</p>
<[email protected]>
</body>
</html>
使其看起来像
My First Heading
My first paragraph.
<[email protected]>
功能
public static string StripHTML(this string htmlText)
{
var reg = new Regex("<(.|\n)*?>", RegexOptions.IgnoreCase);
return reg.Replace(htmlText, "");
}
使用“我得到
我的第一个标题” 我的第一段。
How to strip this text
<html>
<body>
<h1>My First Heading</h1>
<p>My first paragraph.</p>
<[email protected]>
</body>
</html>
to look like
My First Heading
My first paragraph.
<[email protected]>
Using the function
public static string StripHTML(this string htmlText)
{
var reg = new Regex("<(.|\n)*?>", RegexOptions.IgnoreCase);
return reg.Replace(htmlText, "");
}
I get
My First Heading
My first paragraph.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
data:image/s3,"s3://crabby-images/d5906/d59060df4059a6cc364216c4d63ceec29ef7fe66" alt="扫码二维码加入Web技术交流群"
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
使用 Html Agility Pack 进行此类操作。它比任何正则表达式都快并且支持 LINQ。
Use Html Agility Pack for these kinds of operations. It is faster than any regex and supports LINQ.