html-parsing

html-parsing

文章 0 浏览 6

尝试获取输入/ getelementbyID 或 Class 并将其放入 richtextbox 中

我目前正在使用 HtmlAgility Pack 首先解析表单输入标签的一些 HTML,然后获取 ID 或类的名称并列出输入和 id="something here 或 input: class="some…

指尖上得阳光 2024-12-19 18:07:21 1 0

为什么将 html 标签的结束右尖括号放在新 html 标签的左尖括号旁边?

我看到一个使用这种类型的代码结构编写的黑客,其中结束标签右“尖括号”放置在新的左“尖括号”标签开头的开头,但我不记得为什么这样做或线程。我认…

拥抱我好吗 2024-12-19 17:51:06 0 0

如何使用Python显示网页?

我想读取 Python 中的用户输入以获取网址(例如 http://www.google.com)然后以 HTML 格式(仅限文本)将网页打印到终端。我尝试使用 pexpect.spawn('…

守望孤独 2024-12-19 09:01:05 3 0

为什么 HTMLParser 会丢失一些标签?

我使用 HTMLParser 来计算 http://www.worldgolf.com/courses/ 中有多少个 h2 标签usa/massachusetts/ 这是代码: class City2Parser(HTMLParser): de…

草莓酥 2024-12-19 03:08:56 0 0

使用 HTML 解析器 (org.htmlparser) 提取和清理 HTML 片段

我正在寻找一种有效的方法来从网页中提取 HTML 片段并对该 HTML 片段执行一些特定操作。 所需的操作是: 删除所有具有“隐藏”类别的标签 删除所有脚…

落叶缤纷 2024-12-19 00:05:37 0 0

JQuery:使用标记选择?

我正在动态查找页面中的开放标签字符串,并希望使用 JQuery 来获取开放标签对应的元素的文本。 例如,假设这是我的页面: The Arab Awakening and Isr…

独留℉清风醉 2024-12-18 19:32:41 0 0

使用 Apache Tika 解析 HTML 问题

我正在爬行一个网页,爬行后从该网页中提取所有链接,然后我尝试使用下面的代码使用 Apache Tika 和 BoilerPipe 解析所有 url,因此对于某些 url,它…

平安喜乐 2024-12-18 13:59:19 1 0

解析 HTML 时如何在 Java 中跟踪 ChangedCharSetException?

我将以下代码与 javax.swing.text.html.parser.ParserDelegator 结合使用,以便解析网站中的超链接。 InputStream inputStream; InputStreamReader in…

醉南桥 2024-12-18 13:16:46 3 0

twitter.com 的标题

WebClient x = new WebClient(); string source = x.DownloadString("http://www.facebook.com/"); string title = Regex.Match(source, @"\]*\>\s*(?…

街角迷惘 2024-12-18 12:17:41 0 0

解析HTML时,随机字符被添加到字符串中?

我正在解析 HTML 页面的表格,但当我显示数据时,会添加随机字符,如本示例所示: Preowiveding,但它应该是 Preding。 我不知道这是否是一项防止人们…

剩一世无双 2024-12-18 07:07:44 0 0

使用 file_get_contents 解析 html 表到 php 数组

我正在尝试将 此处 显示的表解析为多维 php 数组。我正在使用以下代码,但由于某种原因它返回一个空数组。在网上搜索后,我发现 这个site 这是我从中…

起风了 2024-12-18 06:48:02 0 0

解析 HTML/XML 并查找原始文档中元素的位置

有没有办法获取文档中元素的原始位置,即。在Python中解析html/xml时的开始和结束字符索引? 我查看了 lxml 文档,但找不到任何内容。 例如。 12 ... …

诗酒趁年少 2024-12-18 06:18:38 0 0

ruby正则表达式扫描多个匹配项

我正在尝试获取两个标签之间的文本。 foobar => bar 我尝试使用 'asdasdqwe>'.scan(/[a-zA-Z0-9]*(.*)/) 它给了我正确的结果。 但是当我尝试这个时: …

黑白记忆 2024-12-18 02:59:53 1 0

使用 Jsoup 保留行

我正在使用 Jsoup 从 html 获取一些数据,我有这样的代码: System.out.println("nie jest"); StringBuffer url=new StringBuffer("http://www.darkly…

画▽骨i 2024-12-18 02:07:11 0 0

Html Agility Pack 寻找视频源

嘿,我正在尝试在网页源中找到冲击波视频的参数。来源看起来像这样: 我只需要从上面得到这个: http://mediawebsite.com/lcmplayer.swf?autoStart=1&…

柠檬 2024-12-18 01:30:05 4 0
更多

推荐作者

紫罗兰の梦幻

文章 0 评论 0

-2134

文章 0 评论 0

liuxuanli

文章 0 评论 0

意中人

文章 0 评论 0

○愚か者の日

文章 0 评论 0

xxhui

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文