html-parsing

html-parsing

文章 0 浏览 3

用于像浏览器一样清理 HTML 的 Java 库

所以这就是挑战......我需要从野外的随机网页创建干净的 HTML。我的目标是读入一个页面并将其传递给一个库,该库反过来会返回格式完美的 HTML。 听起…

烧了回忆取暖 2024-11-09 18:03:03 0 0

如何从其兄弟节点获取img的src和数据

&lt?php $htmlget = new DOMDocument() @$htmlget-&gtloadHtmlFile(http://www.amazon.com) $xpath = new DOMXPath( $htmlget) $nodelist = $xpath-&g…

南巷近海 2024-11-09 13:01:55 0 0

Android jSoup 帮助

我正在尝试从此网址解析html http:// skyalipi.blogspot.com/2011/04/there-is-no-resistance-without.html 使用 jSoup。我 Document doc = Jsoup.par…

药祭#氼 2024-11-09 12:33:17 0 0

使用 Javascript 从 HTML 中提取文本

我想用纯 Javascript 从 HTML 中提取文本(这是针对 Chrome 扩展的)。 具体来说,我希望能够在页面上查找文本并在其后提取文本。 更具体地说,在 htt…

愛放△進行李 2024-11-09 05:12:27 0 0

在 iPhone 上从 HTML 中提取简单文本?

&ltdiv dir="ltr"&gt TEXT TO EXTRACT &lt/div&gt &ltdiv dir="ltr"&gt TEXT &ampamp MORE TEXT&ampquotTEXT&ampquot TEXT&lt/div&gt 上面是我希望将…

辞旧 2024-11-08 23:32:16 1 0

从非唯一表上的 html 检索字符串

这是我试图解析的 html。 &ltTD&gtSerial Number&lt/TD&gt&ltTD&gtAB12345678&lt/TD&gt 我正在尝试使用正则表达式来解析数据。我听说过 BeautifulSoup…

装纯掩盖桑 2024-11-08 03:11:01 0 0

从外部网址获取标题和图像时的 Html 敏捷包问题

我正在使用 HTML Agility DLL 来获取外部网站链接的图像和标题。 当我尝试从网站加载标题时。 http://www.gettyimages.com 然后我得到了错误的标题。 …

眼泪淡了忧伤 2024-11-07 04:19:26 0 0

使用 Python 解析文本块

我正在编写一个脚本来解析网页,并将结果粘贴到 MySQL 中。 以下是我需要解析的返回 HTML 内容的示例: &ltTH ALIGN=center COLSPAN=6 BGCOLOR="#C0C0…

蔚蓝源自深海 2024-11-07 03:35:21 0 0

维基百科使用哪种维基标记解析器?

维基百科不使用这些解析器;他们都没有正确处理维基代码。 有谁知道维基百科使用什么解析器?…

凌乱心跳 2024-11-06 11:11:14 1 0

Firefox 扩展中 XMLHTTPRequest 的 HTML DOM 解析和字符编码

我现在正在编写 Firefox 4 引导扩展。 以下是我的故事: 当我使用@mozilla.org/xmlextras/xmlhttprequest1, nsIXMLHttpRequest时,目标URL的内容可以…

森林散布 2024-11-06 05:24:54 0 0

删除
来自已解析的 Beautiful Soup 列表的标签?

我目前正在进入一个 for 循环,其中包含我想要的所有行: page = urllib2.urlopen(pageurl) soup = BeautifulSoup(page) tables = soup.find("td", "b…

最初的梦 2024-11-06 05:21:37 1 0

从 html 解析器获取元素

我正在使用 JSOUP,并尝试获取以特定 div 标签 id 开头的元素。例如: &ltdiv id="test123"&gt. 我需要检查元素是否以字符串“test”开头并获取所有元…

如日中天 2024-11-05 20:33:15 1 0

HTML 标签的正则表达式

我正在执行以下操作: &lt? $text = preg_replace ("/&ltp&gt(.*?)&lt\/p&gt/", "$1&ltbr&gt", "$text") ?&gt 这样我就可以摆脱 标签并在字符串末尾放…

云柯 2024-11-05 20:12:38 0 0

如何使用 Python 解析带有表格的 HTML 文件

我有一个带有表格的 html 文件(它很大,所以只给出了示例代码)。我想检索表中的值。我尝试了 python 中的 HTMLParser 库。 我开始像下面这样编码。…

゛清羽墨安 2024-11-05 19:02:24 1 0

解析html代码出现html错误问题

我想解析链接: http://dizli.com/dizli/db.html 使用php。 但是当我编写代码时, $url = "http://dizli.com/dizli/db.html" $dom = new DOMDocument(…

A君 2024-11-05 12:06:22 0 0
更多

推荐作者

lorenzathorton8

文章 0 评论 0

Zero

文章 0 评论 0

萧瑟寒风

文章 0 评论 0

mylayout

文章 0 评论 0

tkewei

文章 0 评论 0

17818769742

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文