如何在c#中解析HTMLDocument?

发布于 2024-09-11 02:26:01 字数 979 浏览 5 评论 0原文

我想使用 C# 中的简单应用程序获取 html 页面的文本? 如果有嵌套元素 即,

<Table>
    <TR>
        <TD>**ABC**
        </TD>
        <TD>**1**
        </TD>
   </TR>
   <TR>
        <TD>**XYZ**
        </TD>
        <TD>**2**
        </TD>
   </TR>
</Table>

如何直接获取文本(粗体)值。我想将它们保存在我的数据库中,并且还想在 gridview 中显示?

 HtmlDocument htmlSnippet = new HtmlDocument();
 htmlSnippet = LoadHtmlSnippetFromFile();

 private HtmlDocument LoadHtmlSnippetFromFile()
 {
     //TextReader reader = File.OpenText(Server.MapPath("~/App_Data/HtmlSnippet.txt"));

     WebClient webClient = new WebClient();
     const string strUrl = "http://www.dsebd.org/latest_PE_all2_08.php";

     Stream reader = webClient.OpenRead(strUrl);

     HtmlDocument doc = new HtmlDocument();
     doc.Load(reader);

     reader.Close();

     return doc;
}

从这个 htmlSnippet 我如何获取该值?

I want to get the text of an html page using a simple application in c#?
If there are nested elements
ie.,

<Table>
    <TR>
        <TD>**ABC**
        </TD>
        <TD>**1**
        </TD>
   </TR>
   <TR>
        <TD>**XYZ**
        </TD>
        <TD>**2**
        </TD>
   </TR>
</Table>

How can I get the text(bold) directly values.I want to save them in my database and also want to show in gridview?

 HtmlDocument htmlSnippet = new HtmlDocument();
 htmlSnippet = LoadHtmlSnippetFromFile();

 private HtmlDocument LoadHtmlSnippetFromFile()
 {
     //TextReader reader = File.OpenText(Server.MapPath("~/App_Data/HtmlSnippet.txt"));

     WebClient webClient = new WebClient();
     const string strUrl = "http://www.dsebd.org/latest_PE_all2_08.php";

     Stream reader = webClient.OpenRead(strUrl);

     HtmlDocument doc = new HtmlDocument();
     doc.Load(reader);

     reader.Close();

     return doc;
}

From this htmlSnippet how could i get the value?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

把回忆走一遍 2024-09-18 02:26:01

我不确定您需要什么...根据您的示例,您想要一个字符串 "**ABC****1****XYZ****2**"

那么这应该可以工作: htmlSnippet.Body.OuterText

编辑:好的,尝试为单独的值提供一个示例...

HtmlElement tableElement = FindElement(HtmlDocument.Body, "table");
foreach(HtmlElement row in tableElement.Children)
{
    if (row.Name.ToLower() == "tr")
    {
        // create whatever class you use for a row
        foreach(HtmlElement cell in row.Children)
        {
            if (cell.Name.ToLower() == "td")
            {
                // add a new cell to your row using cell.InnerText
            }
        }
    }
}

// *** snip ***

private HtmlElement FindElement(HtmlElement element, string name)
{
    if (element.Name.ToLower() == name)
    {
        return element;
    }
    foreach(HtmlElement child in element.Children)
    {
        HtmlElement test = FindElement(test, name);
        if (test != null)
        {
            return test;
        }
    }
    return null;
}

抱歉,我现在没有 Visual Studio 来测试代码...祝你好运;-)

I'm not sure, what you need ... given your example, do you want a string "**ABC****1****XYZ****2**"?

Then this should work: htmlSnippet.Body.OuterText

EDIT: Ok, trying for a example for separate values ...

HtmlElement tableElement = FindElement(HtmlDocument.Body, "table");
foreach(HtmlElement row in tableElement.Children)
{
    if (row.Name.ToLower() == "tr")
    {
        // create whatever class you use for a row
        foreach(HtmlElement cell in row.Children)
        {
            if (cell.Name.ToLower() == "td")
            {
                // add a new cell to your row using cell.InnerText
            }
        }
    }
}

// *** snip ***

private HtmlElement FindElement(HtmlElement element, string name)
{
    if (element.Name.ToLower() == name)
    {
        return element;
    }
    foreach(HtmlElement child in element.Children)
    {
        HtmlElement test = FindElement(test, name);
        if (test != null)
        {
            return test;
        }
    }
    return null;
}

Sorry, I have no Visual Studio here right now to test the code ... good luck ;-)

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文