text-mining

text-mining

文章 0 浏览 6

潜在语义分析概念

我读过有关使用奇异值分解(SVD)在文本语料库中进行潜在语义分析(LSA)的内容。我已经了解如何做到这一点,也了解 SVD 的数学概念。 但我不明白为什…

梓梦 2024-11-29 23:20:49 6 0

Word Net - 单词同义词和同义词相关单词构造 - Java 或 Python

我希望使用 WordNet 从一组基本术语中查找相似术语的集合。 例如,单词“不鼓励” - 潜在同义词可能是:畏惧、忧郁、受阻、悲观。 我还想识别潜在的二…

止于盛夏 2024-11-28 14:50:23 5 0

RapidMiner 情绪分析

我有一组短信,分为正面或负面,保存在 WEKA 中生成的 ARFF 文件中。我想将这些数据转移到 RapidMiner 进行分类和处理。 作为 RapidMiner 的新手,是…

仲春光 2024-11-28 00:06:33 5 0

大型稀疏矩阵的奇异值分解的Java实现

我只是想知道是否有人知道大型稀疏矩阵的奇异值分解(SVD)的java实现?我需要这个实现来进行潜在语义分析(LSA)。 我尝试了 UJMP 和 JAMA 的软件包…

尘世孤行 2024-11-26 05:23:55 3 0

Java 中有用于文本分析/挖掘的 API 吗?

我想知道Java中是否有一个API可以进行文本分析。可以提取文本中所有单词、单独的单词、表达式等的东西。可以告知找到的单词是否是数字、日期、年份、…

吲‖鸣 2024-11-26 04:45:39 4 0

纯统计引擎,还是自然语言处理引擎?

有哪些统计引擎可以产生比 OpenNLP 工具套件更好的结果(如果有)?我正在寻找的是一个引擎,可以从文本中选择关键字并提供对这些动词和词干的提取。…

执笏见 2024-11-19 13:18:30 9 0

文本挖掘 - 从非结构化文本中提取乐队名称

Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进这个问题?通过编辑这篇文章来更新问题,使其仅…

若沐 2024-11-19 11:57:10 7 0

R 文本挖掘包 DocumentTermMatrix 在控制列表中带有字典,占用太多内存

Closed. This question needs details or clarity. It is not currently accepting answers. 想要改进这个问题?通过编辑这篇文章添加详细信息并澄清…

‖放下 2024-11-19 08:50:04 5 0

挖掘维基百科用于文本挖掘的映射关系

我计划开发一个基于网络的应用程序,它可以抓取维基百科以查找关系并将其存储在数据库中。通过关系,我的意思是搜索一个名字,比如“比尔盖茨”,找到…

往昔成烟 2024-11-10 13:05:19 7 0

Lib Linear 如何使用它

总的来说,我对机器学习和文本挖掘相当陌生。我注意到一个名为 Lib Linear 的 ruby​​ 库的存在 https://github.com/tomz /liblinear-ruby-swig。 到…

戈亓 2024-11-09 08:56:00 7 0

如何从 R 访问维基百科?

R 是否有任何包允许查询维基百科(最有可能使用 Mediawiki API)来获取与此类查询相关的可用文章列表,以及导入选定的文章以进行文本挖掘?…

情仇皆在手 2024-11-09 07:38:47 11 0

用于文本处理的Python或Java(文本挖掘、信息检索、自然语言处理)

Closed. This question is opinion-based. It is not currently accepting answers. 想要改进这个问题?更新问题,以便可以通过编辑这篇文章用事实和…

岁月静好 2024-11-08 02:43:21 5 0

在 Ubuntu Lucid 上安装 R 文本挖掘包

R 新手,正在尝试安装文本挖掘包 (tm)。然而当我这样做时 安装.packages(“tm”,依赖项= TRUE) 我收到以下错误: Warning in install.packages("tm…

诗笺 2024-11-07 21:34:32 5 0

数据挖掘中映射数据的算法

我需要抓取一些网页并从中提取内容。我计划选择一些特定的关键字并映射与它们有某种关系的数据。但我不知道如何才能做到这一点。谁能建议我一些算法来…

吹泡泡o 2024-11-07 09:15:55 8 0

主题相关爬虫的字典是如何定义的?

我想知道定义字典来计算特定网站的相关性的最佳方法是什么。至少带有单词的词典似乎是衡量通过链接找到的新网站的相关性的重要方法(例如,如果链接到…

油饼 2024-11-05 18:31:52 5 0
更多

推荐作者

qq_2gSKZM

文章 0 评论 0

∞梦里开花

文章 0 评论 0

qq_IklFPL

文章 0 评论 0

迷途知返

文章 0 评论 0

深海不蓝

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文