使用 lingpipe 进行分类

发布于 2024-11-08 03:19:54 字数 712 浏览 9 评论 0原文

作为我的学术研究项目的一部分，我正在尝试构建一个应用程序，其中我将从网络检索一组网址。任务是将这些 url 中的每一个分类为某个类别。

例如，以下 URL 有关板球 http://www.espncricinfo。 com/icc_cricket_worldcup2011/content/current/story/499851.html 如果我将这个特定的 URL 提供给分类器，它应该将输出类别指定为“体育”。

为此，我使用 lingpipe 分类器。我已按照分类教程进行操作并运行了演示文件夹中的演示。我已经从以下链接下载了20条新闻数据集。 http://people.csail.mit.edu/people/jrennie/20Newsgroups

后来，我将训练样本大小从 20 个减少到 8 个，并运行了分类演示。它可以成功地训练数据，也可以测试数据。

但问题是，我每次想要测试文档的类别时都需要训练分类器吗？如果我运行文档分类，则训练和测试数据都需要 4 分钟。

我可以存储一次训练数据并进行多次分类吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

倾｀听者〃 2024-11-15 03:19:54

您需要将经过训练的模型序列化到磁盘，然后可以反序列化它们并使分类器准备就绪。

一旦你训练了分类器，就可以使用

 AbstractExternalizable.compileTo(classifier,modelFile);

将模型写入磁盘。

要阅读，您需要

AbstractExternalizable.readObject(modelFile);

查看 AbstractExternalizable 的 Java 文档。

该模型将无法接受额外的训练事件，因为
它已被编译。

You need to serialize the the trained models to disk and then you can deserialize them and have the classifier ready to go.

Once you have a classifier trained up use

 AbstractExternalizable.compileTo(classifier,modelFile);

To write the model to disk.

To read in you will need

AbstractExternalizable.readObject(modelFile);

Look at the Java doc for AbstractExternalizable.

The model will not be able to accept additional training events because
it has been compiled.

回复收藏 0 原文

~没有更多了~

关于作者

冷…雨湿花

暂无简介

文章

29 人气

关注发私信

十二

文章 0 评论 0

关注

飞烟轻若梦

文章 0 评论 0

关注

OPleyuhuo

文章 0 评论 0

关注

wxb0109

文章 0 评论 0

关注

旧城空念

文章 0 评论 0

关注

-小熊_

文章 0 评论 0

友情链接

文江博客

使用 lingpipe 进行分类

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

使用 lingpipe 进行分类

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。