如何使用正则表达式从列表中的html文件中获取所有html标签

发布于 2024-09-19 16:08:18 字数 200 浏览 0 评论 0原文

文件包含标签，因为

<html><head></head><body><span class=style32></span>....

我只想要 html 标签，即列表中的 span、head、body。不应重复。请帮助我，我是正则表达式的新手。

原文

file contains tag as

<html><head></head><body><span class=style32></span>....

i want only the html tag i.e span,head,body in list.There should not be duplicates.
please help me i'm new to regular expressions.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

白云悠悠 2024-09-26 16:08:18

var tagList = new List<string>();
                 string pattern = @"(?<=</?)([^ >/]+)"
                 var matches = Regex.Matches(file, pattern);

for (int i = 0; i < matches.Count; i++)
                 {

                     tagList.Add(matches[i].ToString());

                 }
                     //to obtain non duplicate list
                     tagList = tagList.Distinct().ToList();

var tagList = new List<string>();
                 string pattern = @"(?<=</?)([^ >/]+)"
                 var matches = Regex.Matches(file, pattern);

for (int i = 0; i < matches.Count; i++)
                 {

                     tagList.Add(matches[i].ToString());

                 }
                     //to obtain non duplicate list
                     tagList = tagList.Distinct().ToList();

回复收藏 0 原文

~没有更多了~