html-parsing

html-parsing

文章 0 浏览 6

scrapy 带有换行符和嵌套标签

免责声明:scrapy 新手。 我有一个带有非常不规则行的表,基本结构是: some text some other text yet some text 但偶尔(几百次)某些行是 some tex…

我要还你自由 2024-12-29 08:36:45 0 0

使用 XPath 提取节点值

我想从 amazon.com 的一个部分中提取每个项目的数据(仅节点值,而不是链接)。 我正在寻找的值在里面 Any Department Books Crafts, Hobbies & Home(…

层林尽染 2024-12-29 07:58:50 0 0

Jsoup 删除引号和撇号

我的代码中有类似的东西 Whitelist whitelist = new Whitelist(); whitelist.addTags("p", "i", "b", "em", "strong", "u"); String content = Jsoup.…

尐偏执 2024-12-28 19:01:14 0 0

在WinForm中解析html页面,C#

我正在使用 HtmlAgility 包来解析 html 页面。我能够从必须获取数据的位置找到我的部分。实际上它是一个表,我必须解析它的 tr。 基本上,我有两个疑…

甜`诱少女 2024-12-28 17:31:22 0 0

PHP:查找所有 CSS 文件的内容

我的要求是从给定 URL 查找某些特定 CSS 内容的所有 CSS 内容(外部、内部和内联)。我目前正在使用“PHP Simple HTML DOM Parser”来查找 HTML。但是…

好多鱼好多余 2024-12-28 17:07:17 2 0

从 HTML 元素内的在线 javascript 函数调用内部获取号码

我试图匹配 open('') 内的整数,但收到错误: 警告:preg_match():找不到结束分隔符“^” 这是我的代码: $linkvar ="more"; preg_match("^[0-9]$", …

一个人的旅程 2024-12-28 11:50:04 0 0

如何从字符串中删除 HTML 编码的字符?

我有一个包含一些 HTML 编码字符的字符串,我想删除它们: "<div>Hi All,</div><div class=\"paragraph_break\">< /></di…

ぇ气 2024-12-28 03:52:06 1 0

BeautifulSoup 和表行内的换行符?

示例代码: from BeautifulSoup import BeautifulSoup, SoupStrainer html=''' Foo Bar ''' soup=BeautifulSoup(html) rows=soup.findAll('tr') print…

坦然微笑 2024-12-28 03:50:14 1 0

如何防止 BeautifulSoup 自动关闭那些看起来像标签但实际上不是的东西?

我使用 BeautifulSoup 来转义任意文本集中的所有 HTML 标签(一组预先批准的标签除外,例如 a)。但是,我只希望它转义标签(如果它们是实际有效的 HT…

余厌 2024-12-27 02:55:06 0 0

如何在iPhone上显示Xpath

我正在尝试从 此处。到目前为止,它解析了所有数据,但我一直困惑于如何提取内容并将其显示在表格中。 这就是我到目前为止所得到的: NSData *data = …

一指流沙 2024-12-27 02:24:26 1 0

在毫无头绪的情况下解析和分割多个 HTML 页面

我有大约 50 个与我的项目相关的原始 HTML 页面内容。我不确定这些内容是否有独特的模式。 我需要解析所有页面的内容,并且必须根据关键字进行分类。 …

无言温柔 2024-12-26 03:50:08 0 0

为什么 Array.to_s 返回括号?

对于数组,当我键入: puts array[0] ==> text 然而当我键入时 puts array[0].to_s ==> ["text"] 为什么要使用括号和引号?我缺少什么? 附录:我的代…

北陌 2024-12-26 02:29:40 0 0

如何迭代表并获取中的数据java中不使用tabel的id属性的标签

我知道可以通过 getElementbyId(tableId) 来完成,但我这里没有 id 属性。该表就像 data data5 data1 data2 我正在使用 Htmlunit 一样。有没有办法使…

玩套路吗 2024-12-26 01:25:31 1 0

Python BeautifulSoup 解析特定文本

我正在解析一个 html 文件,我想找到文件中写着“较小的报告公司”的部分,并且旁边有一个“X”或复选框,或者没有。该复选框通常使用 Wingdings 字体…

左耳近心 2024-12-26 00:55:16 0 0

使用 Javascript 注入 HTML 代码

我有一个简单的 html 片段,在运行时将其添加到文档中。我正在使用 jQuery 的选择器,但这应该与我面临的问题无关。 使用时: $("#elementID").html()…

雨落□心尘 2024-12-25 19:59:47 2 0
更多

推荐作者

卷耳

文章 0 评论 0

佚名

文章 0 评论 0

℉服软

文章 0 评论 0

qq_2gSKZM

文章 0 评论 0

凉宸

文章 0 评论 0

gyhjy

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文