html-parsing

html-parsing

文章 0 浏览 6

从 HTML TD 和 Tr 中提取值

我有一些从选项报价网站获得的 HTML 源代码。 (请参见下文) 根据执行价格提取 tr 中的各种文本值并将其存储在集合中的最佳方法是什么(在本例中为 4…

只怪假的太真实 2024-12-25 15:58:05 1 0

Beautiful Soup - 抓取第一个指定标签后的字符串

我试图在开始 标记之后立即获取字符串。以下代码有效: webpage = urlopen(i).read() soup = BeautifulSoup(webpage) for elem in soup('td', text=re…

雨巷深深 2024-12-25 09:23:43 0 0

Jsoup 在指定标签之后开始解析还是从页面底部开始?

我有一个正在用 Jsoup 解析的 HTML 块,但是,并非所有内容都是相关的,并且解析不相关的部分会丢弃我的数据集。 网站上有一个可以随时更改的标题。此…

空城缀染半城烟沙 2024-12-25 07:36:32 0 0

如何使用perl获取网页中的所有链接?

我想使用 perl 从网页获取所有链接 (,我应该使用哪个模块?或者自己使用正则表达式?…

尐偏执 2024-12-25 03:19:06 0 0

在java中从文档中删除html标签的最快方法是什么?

我有一堆网页文档,想从中删除 html 标签。我在 StackOverflow 上看到了一些关于如何使用 java 的帖子,从正则表达式到 HtmlCleaner 和 Jsoup。 我有…

终止放荡 2024-12-24 19:53:26 0 0

使用 xpath 获取部分字符串匹配的 html 标签

html代码是盲目的,它在html中包含字符串“PRICE”。该部分字符串必须与 html 文本匹配。如果文本使用 xpath 匹配(部分匹配)。它应该返回特定的 htm…

情丝乱 2024-12-24 17:00:39 0 0

从 HTML 片段中删除空标签对

我有一个用户提交的字符串,其中包含 HTML 内容,例如 "Helloworld" 我想转换该字符串,以便删除空标记对(但保留像 这样的空标记)。例如,此转换的…

桜花祭 2024-12-24 17:00:33 0 0

为什么 Jericho 解析器无法解析这段 HTML 代码?

我在应用程序中使用 jericho 解析器来获取网页的更轻版本,并从中提取一些部分。因此,例如,当我得到这段代码时: Happy New Year! Posted By '); //…

糖果控 2024-12-23 18:53:41 0 0

解析 iOS 应用程序中的标准化 HTML

我正在开发一个以 html 形式提取内容的 iOS 应用程序。这并不理想,但却是我目前所要做的。无论如何,html 采用以下标准格式: ....Any old html up t…

我最亲爱的 2024-12-23 12:52:56 0 0

Javascript 正则表达式解析 HTML 和自动换行?

我需要创建一些 Javascript,它可以从文本框中搜索输入的 HTML,并忽略所有标签,以按设定数字(例如 70)自动换行,并添加 标签。 我还需要找到所有 …

草莓味的萝莉 2024-12-23 05:35:13 3 0

使用 Objective C 在 iPhone 中创建 MS Word 文档

我在 UIWebview 中创建了一个富文本编辑器。我的要求是将此文本保存在 .doc word 文件中。如何实现这一目标。我通过使用获取 html 内容 NSString *str…

悲喜皆因你 2024-12-23 04:23:59 0 0

使用 Nutch 获取特定的 HTML 标签

我会很详细地明确说明问题,所以请耐心等待:) 假设我有以下基本 URL: http://www.amazon.com/gp/goldbox/all-deals?ie=UTF8&type=bd 其中列出了一些…

剑心龙吟 2024-12-23 01:19:28 1 0

使用lxml解析HTML数据

我是编码初学者,我的一个朋友告诉我使用 BeautifulSoup 而不是 htmlparser。在遇到一些问题后,我得到了使用 lxml 而不是 BeaytifulSoup 的提示,因…

寄意 2024-12-22 21:53:29 1 0

从 html 字符串中提取数据的库

有没有免费/开源的 C# 库可以从 html 中提取数据? 鉴于下面的输入, text part 1 text part 2 我希望输出为: text part 1 text part 2 …

七禾 2024-12-22 05:45:01 0 0

使用 JavaScript 清理 HTML

在我正在开发的应用程序中,用户在文本框中输入 HTML,以编辑页面上的元素。在此阶段,用户可以添加任何类型的内容,甚至是损坏的 HTML 和一些文本节…

梦在夏天 2024-12-22 04:13:25 3 0
更多

推荐作者

卷耳

文章 0 评论 0

佚名

文章 0 评论 0

℉服软

文章 0 评论 0

qq_2gSKZM

文章 0 评论 0

凉宸

文章 0 评论 0

gyhjy

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文