html-agility-pack

html-agility-pack

文章 0 浏览 6

HTML Agility Pack 无法捕获格式错误的 HTML 中的错误

我正在使用 HTML Agility Pack 来验证 HTML 是否有效,然后再发送格式正确或格式错误的电子邮件。 我当前正在测试的代码是 void Main() { var htmlDoc…

南汐寒笙箫 2025-01-12 09:29:49 0 0

从安全网页中抓取文本? (C#)

基本上,我试图从中抓取文本的网站是安全的,并且只有那些我认为是组织设置的 VPN 的人才能访问。 当我今天测试我的工具时,在这个地方连接到网络时,…

黑色毁心梦 2025-01-11 07:47:34 1 0

选择其中包含多个格式标记的文本字符串

上下文: 使用 htmlagility pack 处理 html 文档的 VB.NET 应用程序。 问题: 在 html 文档中,我想为所有以 # 开头并以空格结尾的字符串添加 URL 前…

无人问我粥可暖 2025-01-10 16:05:54 1 0

将 htmlagilitypack 节点转换为 htmlelement .net

我刚刚使用 htmlagilitypack 从 html 文档中将所有链接提取为 htmlnode,但我需要从我的函数中将其返回为 htmlelement Dim Tags As HtmlNodeCollectio…

旧情别恋 2025-01-08 14:24:14 0 0

使用 Html Agility Pack 将 .NET 服务器控件插入 DIV

我选择了这样的 DIV: var divEl = doc.DocumentNode.SelectSingleNode("//div[@id='" + field.Id + "']"); 此 DIV 是空的。现在我需要向该 DIV 添加…

迷爱 2025-01-07 23:09:16 1 0

在 HtmlAgilityPack、Xpath 中使用谓词

我想从网站获取数据。我正在使用 HtmlAgilityPack (C#)。网站内容是这样的 A1 A2 A3 A4 A5 A6 A7 这里,我们有 7 个 class="href1" 的链接。我只想获…

生生不灭 2025-01-06 17:10:27 2 0

TD内的XPath所有A还包含具有“Directs”内部文本的H3。

我正在抓取一个网站。有一个 TD,其中第一个子节点是 H3,其内部文本为“Directs”。在 TD 中,其他子项(H3 除外)是链接。我知道 XPath 完全能够从 …

浅浅淡淡 2025-01-06 03:17:51 2 0

如何获取所有同级 ul 标签?

这是一个 HTML 片段: 来自:http://www.sphere-light.com/compatibility/maker/ id/4/ a .... .... .... .... .... .... b .... .... .... .... ....…

逆光飞翔i 2025-01-05 16:57:32 1 0

我可以使用 Html Agility Pack 从当前页面加载元素吗?

我使用 html 文件加载 DIV 内容,并在 .aspx 页面中显示内容, DocHtml.Load(@"C:\EmailsMKT\modelo1\modelo1.html"); HtmlNode Nodes = DocHtml.Docu…

苹果你个爱泡泡 2025-01-04 07:53:13 0 0

htmlagilitypack多线程中cpu使用率超过50%

我的应用程序使用 10 个线程来读取大量 html 文件。类似于以下代码: for (int i = 0; i < 10; i++) { new Thread(ParserHtmlWork) { IsBackground = …

知足的幸福 2025-01-03 08:29:40 1 0

HtmlAgilityPack XPath 大小写忽略

当我使用 SelectSingleNode("//meta[@name='keywords']") 它时不起作用,但是当我使用原始文档中使用的相同大小写时,它工作得很好: SelectSingleNod…

葬花如无物 2025-01-02 18:31:30 4 0

如何使用 C# 发布到 ASP.NET 验证所需的页面并读取响应

我正在编写自己的特定产品爬虫。现在有一个产品销售网站,其页面使用帖子数据。我真的非常需要能够发布数据并阅读响应。但他们使用的是 asp.net 验证…

紙鸢 2025-01-02 12:33:50 0 0

为什么 HTML Agility Pack HtmlDocument.DocumentNode 为 null?

我使用此代码来更改 HTML 流的 href 属性。 首先,我使用此代码下载完整的 html 页面:(URL 是网页地址) HttpWebRequest myHttpWebRequest = (HttpW…

深海里的那抹蓝 2025-01-01 23:42:26 1 0

如何使用 htmlagilitypack 抓取 xml 文件

我需要从 http://feeds.feedburner.com/Torrentfreak 中抓取 xml 文件的链接和描述。 我使用了这段代码: var webGet = new HtmlWeb(); var document …

心碎的声音 2025-01-01 21:33:14 0 0

从 InnerText 中删除注释行

我目前正在使用下面的代码来提取 InnerText,但是,发生的情况是我被一堆 html 注释行所困扰 <-- 如何使用代码删除它们以下? HtmlWeb hwObject = new…

浅忆流年 2025-01-01 13:42:54 1 0
更多

推荐作者

佚名

文章 0 评论 0

羁客

文章 0 评论 0

文章 0 评论 0

夏日落

文章 0 评论 0

隐诗

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文