内置正则表达式类或解析器。如何从 html 文件中提取标签之间的文本?

发布于 2024-08-23 14:12:34 字数 455 浏览 5 评论 0原文

我的 c#.net 应用程序中有 html 文件,其中包含表格内容和其他信息。

我只想解析某些列的表内容。那么我应该使用 html 解析器还是 Replace 方法 Regex 在 .net 中?

如果我使用解析器那么如何使用解析器?解析器会提取标签之间的信息吗?如果是的话怎么使用?如果可能的话请显示示例,因为我是解析器的新手。

如果我使用 Regex 类的 Replace 方法,那么在该方法中如何传递我想要的文件名提取信息?

编辑:我想从html文件中的表中提取信息。为此,我如何使用 html 敏捷解析器?我应该编写什么类型的代码来使用该解析器?

I have html file in which there is table content and other information in my c#.net application.

I want to parse the table contents for only some columns.Then should I use parser of html or Replace method of Regex in .net ?

And if I use the parser then how to use parser? Will parser extract the inforamation which is between the tags? If yes then how to use ? If possible show the example because I am new to parser.

If I use Replace method of Regex class then in that method how to pass the file name for which I want to extract the information ?

Edit : I want to extract information from the table in html file. For that how can I use html agility parser ? What type of code I should write to use that parser ?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

玻璃人 2024-08-30 14:12:34

您刚刚提出一个几乎相同的问题并将其删除。这是我之前给出的答案:


尝试 HTML Agility Pack

这是一个 示例

 HtmlDocument doc = new HtmlDocument();
 doc.Load("file.htm");
 foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
 {
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
 }
 doc.Save("file.htm");

关于您关于正则表达式的额外问题:不要使用正则表达式来解析 HTML 。这不是一个可靠的解决方案。上面的库可以做得更好。

You just asked an almost identical question and deleted it. Here was the answer I gave before:


Try the HTML Agility Pack.

Here's an example:

 HtmlDocument doc = new HtmlDocument();
 doc.Load("file.htm");
 foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"])
 {
    HtmlAttribute att = link["href"];
    att.Value = FixLink(att);
 }
 doc.Save("file.htm");

Regarding your extra question regarding regex: do not use Regex to parse HTML. It is not a robust solution. The above library can do a much better job.

就此别过 2024-08-30 14:12:34

HtmlAgilityPack....

下次 - 之前搜索答案。这肯定是重复的。

小教程

HtmlAgilityPack....

Next time - search for an answer before. This is duplicate for sure.

Little tutorial.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文