第 7 页 - html-parsing

投稿关注

html-parsing

文章 0 浏览 6

尝试获取输入/ getelementbyID 或 Class 并将其放入 richtextbox 中

我目前正在使用 HtmlAgility Pack 首先解析表单输入标签的一些 HTML，然后获取 ID 或类的名称并列出输入和 id="something here 或 input: class="some…

指尖上得阳光 2024-12-19 18:07:21 1 0

为什么将 html 标签的结束右尖括号放在新 html 标签的左尖括号旁边？

我看到一个使用这种类型的代码结构编写的黑客，其中结束标签右“尖括号”放置在新的左“尖括号”标签开头的开头，但我不记得为什么这样做或线程。我认…

拥抱我好吗 2024-12-19 17:51:06 0 0

如何使用Python显示网页？

我想读取 Python 中的用户输入以获取网址（例如 http://www.google.com）然后以 HTML 格式（仅限文本）将网页打印到终端。我尝试使用 pexpect.spawn('…

守望孤独 2024-12-19 09:01:05 3 0

为什么 HTMLParser 会丢失一些标签？

我使用 HTMLParser 来计算 http://www.worldgolf.com/courses/ 中有多少个 h2 标签usa/massachusetts/ 这是代码： class City2Parser(HTMLParser): de…

草莓酥 2024-12-19 03:08:56 0 0

使用 HTML 解析器 (org.htmlparser) 提取和清理 HTML 片段

我正在寻找一种有效的方法来从网页中提取 HTML 片段并对该 HTML 片段执行一些特定操作。所需的操作是：删除所有具有“隐藏”类别的标签删除所有脚…

落叶缤纷 2024-12-19 00:05:37 0 0

JQuery：使用标记选择？

我正在动态查找页面中的开放标签字符串，并希望使用 JQuery 来获取开放标签对应的元素的文本。例如，假设这是我的页面： The Arab Awakening and Isr…

独留℉清风醉 2024-12-18 19:32:41 0 0

使用 Apache Tika 解析 HTML 问题

我正在爬行一个网页，爬行后从该网页中提取所有链接，然后我尝试使用下面的代码使用 Apache Tika 和 BoilerPipe 解析所有 url，因此对于某些 url，它…

平安喜乐 2024-12-18 13:59:19 1 0

解析 HTML 时如何在 Java 中跟踪 ChangedCharSetException？

我将以下代码与 javax.swing.text.html.parser.ParserDelegator 结合使用，以便解析网站中的超链接。 InputStream inputStream; InputStreamReader in…

醉南桥 2024-12-18 13:16:46 3 0

twitter.com 的标题

WebClient x = new WebClient(); string source = x.DownloadString("http://www.facebook.com/"); string title = Regex.Match(source, @"\]*\>\s*(?…

街角迷惘 2024-12-18 12:17:41 0 0

解析HTML时，随机字符被添加到字符串中？

我正在解析 HTML 页面的表格，但当我显示数据时，会添加随机字符，如本示例所示： Preowiveding，但它应该是 Preding。我不知道这是否是一项防止人们…

剩一世无双 2024-12-18 07:07:44 0 0

使用 file_get_contents 解析 html 表到 php 数组

我正在尝试将此处显示的表解析为多维 php 数组。我正在使用以下代码，但由于某种原因它返回一个空数组。在网上搜索后，我发现这个site 这是我从中…

起风了 2024-12-18 06:48:02 0 0

解析 HTML/XML 并查找原始文档中元素的位置

有没有办法获取文档中元素的原始位置，即。在Python中解析html/xml时的开始和结束字符索引？我查看了 lxml 文档，但找不到任何内容。例如。 12 ... …

诗酒趁年少 2024-12-18 06:18:38 0 0

ruby正则表达式扫描多个匹配项

我正在尝试获取两个标签之间的文本。 foobar => bar 我尝试使用 'asdasdqwe>'.scan(/[a-zA-Z0-9]*(.*)/) 它给了我正确的结果。但是当我尝试这个时： …

黑白记忆 2024-12-18 02:59:53 1 0

使用 Jsoup 保留行

我正在使用 Jsoup 从 html 获取一些数据，我有这样的代码： System.out.println("nie jest"); StringBuffer url=new StringBuffer("http://www.darkly…

画▽骨i 2024-12-18 02:07:11 0 0

Html Agility Pack 寻找视频源

嘿，我正在尝试在网页源中找到冲击波视频的参数。来源看起来像这样：我只需要从上面得到这个： http://mediawebsite.com/lcmplayer.swf?autoStart=1&…

柠檬 2024-12-18 01:30:05 4 0

共 54 页
上一页
5
6
7
8
9
下一页

友情链接

文江博客