从 html 字符串中提取数据的库

发布于 2024-12-22 05:45:01 字数 245 浏览 0 评论 0原文

有没有免费/开源的 C# 库可以从 html 中提取数据?

鉴于下面的输入,

<div style="...">
 text part 1
</div>
<div style="...">
 text part 2
</div>

我希望输出为:

text part 1 text part 2

Is there any free/open source c# libraries to extract data from html?

Given the input below

<div style="...">
 text part 1
</div>
<div style="...">
 text part 2
</div>

I want the output to be:

text part 1 text part 2

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

阳光下的泡沫是彩色的 2024-12-29 05:45:01

是的,您可以使用 HtmlAgilityPack 使用 Xpath 查询来解析 HTML,就好像它是 XML 一样。

Yes, you can use HtmlAgilityPack to parse HTML using Xpath queries as if it were XML.

公布 2024-12-29 05:45:01

您可以使用 HtmlAgilitiPack 非常好的库。

进而:

public string StripHTMLTags(string str)
        {
            StringBuilder pureText = new StringBuilder();
            HtmlDocument doc = new HtmlDocument();
            doc.LoadHtml(str);

            foreach (HtmlNode node in doc.DocumentNode.ChildNodes)
            {
                pureText.Append(node.InnerText);
            }

            return pureText.ToString();
        }

you can use HtmlAgilitiPack very good library.

and then:

public string StripHTMLTags(string str)
        {
            StringBuilder pureText = new StringBuilder();
            HtmlDocument doc = new HtmlDocument();
            doc.LoadHtml(str);

            foreach (HtmlNode node in doc.DocumentNode.ChildNodes)
            {
                pureText.Append(node.InnerText);
            }

            return pureText.ToString();
        }
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文