内置正则表达式类或解析器。如何从 html 文件中提取标签之间的文本?
我的 c#.net 应用程序中有 html 文件,其中包含表格内容和其他信息。
我只想解析某些列的表内容。那么我应该使用 html 解析器还是 Replace 方法 Regex 在 .net 中?
如果我使用解析器那么如何使用解析器?解析器会提取标签之间的信息吗?如果是的话怎么使用?如果可能的话请显示示例,因为我是解析器的新手。
如果我使用 Regex 类的 Replace 方法,那么在该方法中如何传递我想要的文件名提取信息?
编辑:我想从html文件中的表中提取信息。为此,我如何使用 html 敏捷解析器?我应该编写什么类型的代码来使用该解析器?
I have html file in which there is table content and other information in my c#.net application.
I want to parse the table contents for only some columns.Then should I use parser of html or Replace method of Regex in .net ?
And if I use the parser then how to use parser? Will parser extract the inforamation which is between the tags? If yes then how to use ? If possible show the example because I am new to parser.
If I use Replace method of Regex class then in that method how to pass the file name for which I want to extract the information ?
Edit : I want to extract information from the table in html file. For that how can I use html agility parser ? What type of code I should write to use that parser ?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您刚刚提出一个几乎相同的问题并将其删除。这是我之前给出的答案:
尝试 HTML Agility Pack。
这是一个 示例:
关于您关于正则表达式的额外问题:不要使用正则表达式来解析 HTML 。这不是一个可靠的解决方案。上面的库可以做得更好。
You just asked an almost identical question and deleted it. Here was the answer I gave before:
Try the HTML Agility Pack.
Here's an example:
Regarding your extra question regarding regex: do not use Regex to parse HTML. It is not a robust solution. The above library can do a much better job.
HtmlAgilityPack....
下次 - 之前搜索答案。这肯定是重复的。
小教程。
HtmlAgilityPack....
Next time - search for an answer before. This is duplicate for sure.
Little tutorial.