使用 LINQ to XML 遍历 HTML 表
因此,我可以轻松地使用 LINQ to XML 来遍历正确设置的 XML 文档。但我在弄清楚如何将其应用到 HTML 表时遇到了一些问题。设置如下:
<table class='inner'
width='100%'>
<tr>
<th>Area</th>
<th>Date</th>
<th>ID</th>
<th>Name</th>
<th>Email</th>
<th>Zip Code</th>
<th>Type</th>
<th>Amount</th>
</tr>
<tr>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
</tr>
<tr>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
</tr>
</table>
本质上,可以有无数行,我希望能够逐行相应地检查数据。有人能指出我正确的方向吗?我是否应该使用 LINQ 以外的工具来实现此目的?
编辑:很抱歉造成混乱,我的问题是我尝试从中收集数据的页面是 HTML,而不是 XML。确切的扩展名是“.aspx.htm”。这似乎没有正确加载,即使它加载了,我也不确定如何遍历 HTML 页面,因为在我尝试从中获取数据的表之前有一个表。
例如,以下是我尝试从中获取信息的表的 XPATH:
/html/body/form/div[3]/table/tbody/tr[5]/td/table
So, I can easily use LINQ to XML to traverse a properly set-up XML document. But I'm having some issues figuring out how to apply it to an HTML table. Here is the setup:
<table class='inner'
width='100%'>
<tr>
<th>Area</th>
<th>Date</th>
<th>ID</th>
<th>Name</th>
<th>Email</th>
<th>Zip Code</th>
<th>Type</th>
<th>Amount</th>
</tr>
<tr>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
</tr>
<tr>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
<td>Data</td>
</tr>
</table>
Essentially, there can be an endless number of rows, I want to be able to go row-by-row to check the data accordingly. Can anyone point me in the right direction? Should I be using tools other than LINQ for this?
EDIT: Sorry about the confusion, my issue is the fact that the page I am trying to gather data from is HTML, not XML. The exact extension is ".aspx.htm". This doesnt seem to load properly, and even if it did I'm not certain how to traverse the HTML page, given that there is one table before the table I'm trying to get data from.
For example, here is the XPATH to the table I'm trying to get info from:
/html/body/form/div[3]/table/tbody/tr[5]/td/table
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
linq 与 sql 类似,它执行基于集合的操作。
您希望专注于使用 foreach 循环来迭代选定的一组 xelement -
linq is like sql it performs set based operations.
You want to focus on using a foreach loop to iterate over the selected set of xelements -
一旦有了带有
的 XElement,您就可以循环访问其子
Elements()
。Once you have an XElement with the
<table>
, you can loop through its childElements()
.