当前位置：文江博客话题详情

text data-mining text-mining

文本挖掘库还是语言库？

发布于 2024-08-18 17:39:35 字数 93 浏览 12 评论 0原文

我从我拥有的论坛中收集了一堆数据，并且想要进行一些文本挖掘或使用一些语言库来提取有用的信息。

任何语言的文本挖掘、数据挖掘库都可以。

谢谢。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（6）

仙女 2024-08-25 17:39:35

我建议您看看 R。它有大量的文本挖掘包：看看自然语言处理查看。特别是查看 tm 包。以下是一些相关链接：

《统计计算杂志》中有关该包的论文：< a href="http://www.jstatsoft.org/v25/i05/paper" rel="nofollow noreferrer">http://www.jstatsoft.org/v25/i05/paper。该论文包含一个很好的 R-devel 分析示例
邮件列表 (https://stat.ethz.ch/pipermail/r-devel/) 2006 年以来的新闻组帖子。
包主页：http://cran .r-project.org/web/packages/tm/index.html
查看介绍性小插图：http://cran.r-project.org/web/packages/tm/vignettes/tm.pdf

另一个有用的包的例子是 Gary King 的自述文件包。

回复收藏 0 原文

爱情眠于流年 2024-08-25 17:39:35

您可能想看看Python NLTK（自然语言工具包）：它是专门为这种类型设计的的东西。

还有一本好书供您入门。

回复收藏 0 原文

撑一把青伞 2024-08-25 17:39:35

Mallet 是一个专为文本挖掘而设计的 java 库。预处理完文本数据后，可以使用通用数据挖掘工具，例如 Weka也足以满足你的任务。

如果您可以使用 SPSS 或 SAS，他们的产品应该更容易使用。

回复收藏 0 原文

独﹏钓一江月 2024-08-25 17:39:35

尝试一下 GATE，它有 GUI，当然你可以使用 java api 来获得更多功能：
http://gate.ac.uk/family/developer.html

您还可以使用Weka 用于处理文本和进行文本挖掘，看看这些有用的讲座：
http://sentimentmining.net/weka/

回复收藏 0 原文

万劫不复 2024-08-25 17:39:35

stanford core-nlp 适用于英文文本，并且具有命名实体识别等功能。看一下：http://nlp.stanford.edu/software/corenlp.shtml

Ehsan 已经推荐的 GATE 也不错，但如果您需要编写自己的组件，它可能会有点复杂。对于大型的东西来说这是很棒的。

UIMA 与 GATE 类似，但使用起来不太方便，因为它不像 GATE 那样具有广泛的 GUI。 (http://uima.apache.org)

回复收藏 0 原文

鸩远一方 2024-08-25 17:39:35

我推荐以下Python库：

nltk
keras
tensorflow

注意：在进行任何文本分析之前，您应该根据您的要求清理数据

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

燃烧我的卡路李先生

文章 0 评论 0

qq_2gSKZM

文章 0 评论 0

∞梦里开花

文章 0 评论 0

qq_IklFPL

文章 0 评论 0

迷途知返

文章 0 评论 0

深海不蓝

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文