读取HTML表格数据/html标签
我有大约 50 页 html,每页大约有 100 多行数据,具有各种 CSS 样式,我想读取 html 文件并获取数据,例如姓名、年龄、班级、教师。并将其存储在数据库中,但我无法读取 html 标签
,例如 我留在这里展示它的空间
<table class="table_100">
<tr>
<td class="col_1">
<span class="txt_student">Gauri Singh</span><br>
<span class="txt_bold">13</span><br>
<span class="txt_bold">VIII</span><br>
</td>
<td class="col_2">
<span class="txt_teacher">Praveen M</span><br>
<span class="txt_bold">3494</span><br>
<span class="txt_bold">3Star</span><br>
</td>
<td class="col_3">
</td>
</tr>
</table>
I have some 50 pages of html which have around 100-plus rows of data in each, with all sort of CSS style, I want to read the html file and just get the data, like Name, Age, Class, Teacher. and store it in Database, but I am not able to read the html tags
e.g
space i kept to display it here
<table class="table_100">
<tr>
<td class="col_1">
<span class="txt_student">Gauri Singh</span><br>
<span class="txt_bold">13</span><br>
<span class="txt_bold">VIII</span><br>
</td>
<td class="col_2">
<span class="txt_teacher">Praveen M</span><br>
<span class="txt_bold">3494</span><br>
<span class="txt_bold">3Star</span><br>
</td>
<td class="col_3">
</td>
</tr>
</table>
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
对于 .NET,您可以尝试 Html Agility Pack
您可以使用以下方法将 HTML 页面“转换”为 XML 文档:
然后只需解析 XML 文档。
For .NET you may try Html Agility Pack
You could "convert" HTML pages to XML documents with this:
And then just parse a XML document.
使用 Html 敏捷包。它提供了一个直观且强大的 .net API,用于解析或使用 Html。
Use Html Agility Pack. It provides an intuitive and robust .net API for parsing and otherwise toying with Html.