text-mining

text-mining

文章 0 浏览 4

R文本文件和文本挖掘...如何加载数据

我正在使用 R 包 tm,我想做一些文本挖掘。这是一个文档,被视为一个词袋。 我不明白有关如何加载文本文件并创建必要的对象以开始使用诸如...之类的功…

鸠书 2024-12-12 09:13:46 0 0

将 Regexpr 与 $ 一起使用

只是一个简单的问题,有谁知道如何将 regexpr 与 "\$" 一起使用?本质上,我想解析字符串并找出 \$ 之后的数值(例如“购买新床架可享受 50 美元折扣…

剩余の解释 2024-12-10 15:03:05 0 0

URL路径相似度/字符串相似度算法

我的问题是我需要比较 URL 路径并推断它们是否相似。下面我提供了要处理的示例数据: # GROUP 1 /robots.txt # GROUP 2 /bot.html # GROUP 3 /phpMyAd…

能否归途做我良人 2024-12-10 07:48:39 0 0

如何使用文本挖掘进行文档分析?

我想分析给定的文档,以确定该文档是否包含我感兴趣的领域知识的内容或与该领域知识无关的内容。 例如,我有一个包含有关 Android 操作系统的数据的文…

夜未央樱花落 2024-12-08 04:28:14 0 0

数据挖掘情况

假设我有下面提到的数据。 11AM user1 刷牙 11:05AM user1 准备 早餐 11:10AM user1 吃早餐 11:15AM user1 洗澡 11:30AM user1 上班 12PM user2 刷牙 …

姜生凉生 2024-12-07 11:02:46 0 0

VIM:如何搜索匹配没有特定字符的行?

我从 ldiff 文件中有一些像这样的行, dn: cn=dkalland_directs_ww,cn=org_groups,cn=beehive_groups,cn=groups,dc=oracle ,dc=com businesscategory:…

櫻之舞 2024-12-03 13:14:06 1 0

对大量字符串进行文本挖掘

我有字符串列表。 (相当大的 id 和字符串列表,分散在 4-5 个大文件中。每个文件大约 1 GB)。这些字符串的格式如下: 1,Hi 2,Hi How ru? 2、怎么样…

执妄 2024-12-03 02:06:10 2 0

sqlite 中的文本挖掘

我有 sqlite 数据库,需要找到其中最常见的单词。 例子, 文字 桌椅地板 桌椅 表 需要的解决方案 字数 表 3 椅子  2 1楼 数据库很大(几GB)。我正在…

背叛残局 2024-12-01 06:30:26 0 0

潜在语义分析概念

我读过有关使用奇异值分解(SVD)在文本语料库中进行潜在语义分析(LSA)的内容。我已经了解如何做到这一点,也了解 SVD 的数学概念。 但我不明白为什…

梓梦 2024-11-29 23:20:49 2 0

Word Net - 单词同义词和同义词相关单词构造 - Java 或 Python

我希望使用 WordNet 从一组基本术语中查找相似术语的集合。 例如,单词“不鼓励” - 潜在同义词可能是:畏惧、忧郁、受阻、悲观。 我还想识别潜在的二…

止于盛夏 2024-11-28 14:50:23 3 0

RapidMiner 情绪分析

我有一组短信,分为正面或负面,保存在 WEKA 中生成的 ARFF 文件中。我想将这些数据转移到 RapidMiner 进行分类和处理。 作为 RapidMiner 的新手,是…

仲春光 2024-11-28 00:06:33 1 0

大型稀疏矩阵的奇异值分解的Java实现

我只是想知道是否有人知道大型稀疏矩阵的奇异值分解(SVD)的java实现?我需要这个实现来进行潜在语义分析(LSA)。 我尝试了 UJMP 和 JAMA 的软件包…

尘世孤行 2024-11-26 05:23:55 0 0

Java 中有用于文本分析/挖掘的 API 吗?

我想知道Java中是否有一个API可以进行文本分析。可以提取文本中所有单词、单独的单词、表达式等的东西。可以告知找到的单词是否是数字、日期、年份、…

吲‖鸣 2024-11-26 04:45:39 2 0

纯统计引擎,还是自然语言处理引擎?

有哪些统计引擎可以产生比 OpenNLP 工具套件更好的结果(如果有)?我正在寻找的是一个引擎,可以从文本中选择关键字并提供对这些动词和词干的提取。…

执笏见 2024-11-19 13:18:30 3 0

文本挖掘 - 从非结构化文本中提取乐队名称

Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进这个问题?通过编辑这篇文章来更新问题,使其仅…

若沐 2024-11-19 11:57:10 3 0
更多

推荐作者

胡图图

文章 0 评论 0

zt006

文章 0 评论 0

z祗昰~

文章 0 评论 0

冰葑

文章 0 评论 0

野の

文章 0 评论 0

天空

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文