Jsoup

Jsoup

文章 218 浏览 219

使用 Jsoup 进行网页抓取只能发挥一半的作用

我最近一直在研究 Java Jsoup 库,试图更好地理解网络抓取(从网站上提取数据)。但我设法组合的代码似乎只能在部分时间起作用。是我的代码有问题,还…

So要识趣 2024-11-29 06:05:27 0 0

解释Jsoup中NodeVisitor接口中的head和tail方法

虽然 Jsoup 似乎是一个非常好的废弃 HTML 的库,但不幸的是它的 API 几乎没有文档。以下是 Nodevisitor 类的 API: http://jsoup.org/apidocs/org /js…

饮惑 2024-11-29 06:04:41 0 0

如何从中解析文本和图像

可能的重复: 如何使用 jsoup 从此 html 页面获取文本? 我正在尝试使用 JSOUP 解析此 HTML 页面中的图像和文本。 http://movies.ign.com/articles/1…

你在看孤独的风景 2024-11-29 03:32:09 0 0

Jsoup 选择并迭代所有元素

我将通过 jsoup 连接到一个 url 并获取它的所有内容,但问题是如果我选择 like, doc.select("body") 它返回一个元素,但我想获取页面中的所有元素并…

此刻的回忆 2024-11-28 23:51:23 0 0

如何使用jsoup从这个html页面获取文本?

我正在使用此代码来检索本页主文章中的文本。 public class HtmlparserExampleActivity extends Activity { String outputtext; TagFindingVisitor vi…

梦初启 2024-11-28 23:11:01 0 0

如何从 HTML 页面中仅提取主要文本内容?

更新 Boilerpipe 似乎工作得很好,但我意识到我不需要只主要内容,因为许多页面没有文章,而只需要对整个文本进行一些简短描述的链接(这在新闻门户中…

吐个泡泡 2024-11-28 21:58:35 1 0

帮助使用 JSoup 抓取 HTML

这里是一个初学者,正在开展一个个人项目,将我的学校课程内容抓取为易于阅读的表格格式,但在从网站抓取数据的第一步中遇到了麻烦。 我刚刚将 JSoup …

尛丟丟 2024-11-28 11:51:14 2 0

如何使用 Jsoup 从链接中提取 href?

我想 index.php?limitstart=0&picno=0&gallery_key=92 index.php?limitstart=0&picno=1&gallery_key=92 index.php?limitstart=0&…

婴鹅 2024-11-27 19:15:46 0 0

缺少任何 HTML 结束标记时的 Jsoup 行为

每当缺少一个 HTML 标签(开始标签或结束标签)时,Jsoup 的默认行为是什么?它会抛出错误还是会忽略现有标签或删除现有标签?…

摇划花蜜的午后 2024-11-27 15:44:56 1 0

为什么 UTF-8 字符在此网页(使用 JSoup 生成)中无法正确呈现?

我在使用 JSoup 库解析和渲染页面时处理字符集时遇到问题。这是它呈现的页面的示例: http://dl.dropbox.com /u/13093/charset-problem.html 如您所见…

怎樣才叫好 2024-11-27 11:25:32 0 0

Jsoup - 尝试从网页中提取评论数

我正在尝试使用 Jsoup 从网页中提取总体评论数。 例如,这是一个页面(CNN): http://edition.cnn.com/2011/POLITICS/07/31/debt.talks/index.html?h…

心的位置 2024-11-27 09:28:00 0 0

有哪些好的 Java 库可以用于搜索和从网页中抓取数据。

有哪些好的开源 Java 库可以从网页中搜索和抓取数据并将其粘贴到数据库中。例如,假设我有一个页面,例如: Address: 123 My Street “地址:”是关键…

摇划花蜜的午后 2024-11-27 06:47:40 0 0

如何解决依赖版本冲突(NoSuchMethodError)

在我的 Spring 3.0.5 Web MVC 应用程序中,我定义了一个模型类,其属性用 @SafeHtml 注释。当 Spring 尝试验证此模型对象时,它会出现以下错误: HTTP…

忘东忘西忘不掉你 2024-11-27 01:14:55 2 0

如何将 Jsoup(Java html 解析器)中生成的文档转换为字符串

我有一个用 jsoup 制作的文档,如下所示 Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); How do i conversion that doc into a st…

土豪我们做朋友吧 2024-11-26 21:06:29 0 0

通过自定义属性查找元素是否高效?

我想知道这样的 select 语句是否有效: elements = document.body().select("[data-custom-attr=blahblah]"); JSoup 是否为所有元素属性和值创建一个 …

会傲 2024-11-26 20:16:43 0 0
更多

推荐作者

胡图图

文章 0 评论 0

zt006

文章 0 评论 0

z祗昰~

文章 0 评论 0

冰葑

文章 0 评论 0

野の

文章 0 评论 0

天空

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文