使用 LINQ to XML 遍历 HTML 表

发布于 2024-09-19 16:32:07 字数 1412 浏览 4 评论 0原文

因此,我可以轻松地使用 LINQ to XML 来遍历正确设置的 XML 文档。但我在弄清楚如何将其应用到 HTML 表时遇到了一些问题。设置如下:

<table class='inner'
       width='100%'>
    <tr>
        <th>Area</th>
        <th>Date</th>
        <th>ID</th>
        <th>Name</th>
        <th>Email</th>
        <th>Zip Code</th>
        <th>Type</th>
        <th>Amount</th>
    </tr>
    <tr>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
    </tr>
    <tr>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
    </tr>
</table>

本质上,可以有无数行,我希望能够逐行相应地检查数据。有人能指出我正确的方向吗?我是否应该使用 LINQ 以外的工具来实现此目的?

编辑:很抱歉造成混乱,我的问题是我尝试从中收集数据的页面是 HTML,而不是 XML。确切的扩展名是“.aspx.htm”。这似乎没有正确加载,即使它加载了,我也不确定如何遍历 HTML 页面,因为在我尝试从中获取数据的表之前有一个表。

例如,以下是我尝试从中获取信息的表的 XPATH:

/html/body/form/div[3]/table/tbody/tr[5]/td/table

So, I can easily use LINQ to XML to traverse a properly set-up XML document. But I'm having some issues figuring out how to apply it to an HTML table. Here is the setup:

<table class='inner'
       width='100%'>
    <tr>
        <th>Area</th>
        <th>Date</th>
        <th>ID</th>
        <th>Name</th>
        <th>Email</th>
        <th>Zip Code</th>
        <th>Type</th>
        <th>Amount</th>
    </tr>
    <tr>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
    </tr>
    <tr>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
        <td>Data</td>
    </tr>
</table>

Essentially, there can be an endless number of rows, I want to be able to go row-by-row to check the data accordingly. Can anyone point me in the right direction? Should I be using tools other than LINQ for this?

EDIT: Sorry about the confusion, my issue is the fact that the page I am trying to gather data from is HTML, not XML. The exact extension is ".aspx.htm". This doesnt seem to load properly, and even if it did I'm not certain how to traverse the HTML page, given that there is one table before the table I'm trying to get data from.

For example, here is the XPATH to the table I'm trying to get info from:

/html/body/form/div[3]/table/tbody/tr[5]/td/table

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

混吃等死 2024-09-26 16:32:29

linq 与 sql 类似,它执行基于集合的操作。

您希望专注于使用 foreach 循环来迭代选定的一组 xelement -

linq is like sql it performs set based operations.

You want to focus on using a foreach loop to iterate over the selected set of xelements -

泪意 2024-09-26 16:32:25

一旦有了带有 的 XElement,您就可以循环访问其子 Elements()

Once you have an XElement with the <table>, you can loop through its child Elements().

平生欢 2024-09-26 16:32:22
XElement myTable = xdoc.Descendants("table").FirstOrDefault(xelem => xelem.Attribute("class").Value == "inner");
IEnumerable<IEnumerable<XElement>> myRows = myTable.Elements().Select(xelem => xelem.Elements());

foreach(IEnumerable<XElement> tableRow in myRows)
{
    foreach(XElement rowCell in tableRow)
    {
        // tada..
    }
}
XElement myTable = xdoc.Descendants("table").FirstOrDefault(xelem => xelem.Attribute("class").Value == "inner");
IEnumerable<IEnumerable<XElement>> myRows = myTable.Elements().Select(xelem => xelem.Elements());

foreach(IEnumerable<XElement> tableRow in myRows)
{
    foreach(XElement rowCell in tableRow)
    {
        // tada..
    }
}
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文