如何从网站中提取特定文本块
我必须从网络中提取有用的信息
我可以使用 C#
示例
标题:abc
我只得到“abc”
i have to extract useful information from web
i can i do using c#
example
title: abc
i have get only "abc"
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
使用 DOM 解析器您可以提取所需的元素。如果您预先知道块 ID 或者您能够准备好它,那么提取就非常简单。
Using DOM parser you can extract required elements. If you pre-aware of the block id or if you able to prepare it then the extraction is quite simple.
如果您需要从网站中提取文本,则需要使用 HTML 解析器,例如 HTML Agility Pack 。
If you need to extract text from a website, you need to use an HTML parser such as the HTML Agility Pack.
正如 @Oded 所建议的,Html Agility Pack 将很有用。
这是 html 敏捷包的示例。
As, @Oded♦ recommended, Html Agility Pack will be useful.
This is example of html agility pack.