需要在 C# 中使用 HTMLAgilityPack 一些 HTML 元素 - 如何做?

发布于 2024-12-06 07:31:31 字数 189 浏览 1 评论 0原文

我有以下场景:

<a href="test.com">Some text <b>is bolded</b> some is <b>not</b></a>

现在,如何获取“test.com”部分和文本的锚点,而不需要粗体部分?

I have the following scenario:

<a href="test.com">Some text <b>is bolded</b> some is <b>not</b></a>

Now, how do I get the "test.com" part and the anchor of the text, without having the bolded parts?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

秋千易 2024-12-13 07:31:31

假设以下标记:

<html>
<head>
    <title>Test</title>
</head>
<body>
    <a href="test.com">Some text <b>is bolded</b> some is <b>not</b></a>
</body>
</html>

您可以执行以下操作:

class Program
{
    static void Main()
    {
        var doc = new HtmlDocument();
        doc.Load("test.html");
        var anchor = doc.DocumentNode.SelectSingleNode("//a");
        Console.WriteLine(anchor.Attributes["href"].Value);
        Console.WriteLine(anchor.InnerText);
    }
}

prints:

test.com
Some text is bolded some is not

当然,您可能想通过向您尝试获取的锚点提供唯一的 id 或类名来调整您的 SelectSingleNode XPath 选择器:

// assuming <a href="test.com" id="foo">Some text <b>is bolded</b> some is <b>not</b></a>
var anchor = doc.GetElementbyId("foo");

Assuming the following markup:

<html>
<head>
    <title>Test</title>
</head>
<body>
    <a href="test.com">Some text <b>is bolded</b> some is <b>not</b></a>
</body>
</html>

You could perform the following:

class Program
{
    static void Main()
    {
        var doc = new HtmlDocument();
        doc.Load("test.html");
        var anchor = doc.DocumentNode.SelectSingleNode("//a");
        Console.WriteLine(anchor.Attributes["href"].Value);
        Console.WriteLine(anchor.InnerText);
    }
}

prints:

test.com
Some text is bolded some is not

Of course you probably wanna adjust your SelectSingleNode XPath selector by providing an unique id or a classname to the anchor you are trying to fetch:

// assuming <a href="test.com" id="foo">Some text <b>is bolded</b> some is <b>not</b></a>
var anchor = doc.GetElementbyId("foo");
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文