tm

tm

文章 0 浏览 3

删除标记之前的数字,标点,白色空间

我从以前的编码帮助中拥有以下数据框架 report <- data.frame(Text = c("unit 1 crosses the street", "driver 2 was speeding and saw driver# 1", "…

离不开的别离 2025-01-23 17:59:56 4 0

row_sums vs findfreqterms用于子集termdocmatrix以包含具有给定最小频率的单词

我的问题很简单。我有一个(二进制)TDM,我想减少至少两个文档中出现的行的行数: 我认为这两种方法会在二进制矩阵中产生相同的结果: > rowTotals =…

掩于岁月 2025-01-23 16:29:00 3 0

土耳其人物问题在绘制图形的图表时问题

我有一个数据集,其中包括土耳其语的推文。我正在尝试使用TM软件包进行文本挖掘,并使用IGRAPH R软件包绘制网络。 library(tm) #build corpus corpus …

腹黑女流氓 2025-01-19 15:26:24 2 0

如何添加目标变量来查看句子属于数据1还是数据2?

我正在从事一个项目。我想用类似情况来总结它。我需要收集n个带有不同HASTAG的推文。 这是类似的代码: library(tm) #tweets from first hastag tweet…

多孤肩上扛 2025-01-19 13:02:40 2 0

从 R 中的文档术语矩阵恢复原始数据

我想知道在将其制作为文档术语矩阵后是否有办法返回到我的原始数据库(df)。 这是我想做的一个例子。 df <- data.frame(group=c("A","A","B","B","C"…

终陌 2025-01-11 07:27:47 8 0

在 tm DocumentTermMatrix 中包含短标记

编辑:这是工作区中的对象发生冲突并导致意外行为的问题。 我正在尝试使用以下代码从文档创建 DocumentTermMatrix。该文档包含许多 1 字符和 2 字符标…

难理解 2025-01-03 12:12:38 2 0

R文本文件和文本挖掘...如何加载数据

我正在使用 R 包 tm,我想做一些文本挖掘。这是一个文档,被视为一个词袋。 我不明白有关如何加载文本文件并创建必要的对象以开始使用诸如...之类的功…

鸠书 2024-12-12 09:13:46 6 0

tm 包错误“由于向量太大,无法将 DocumentTermMatrix 转换为普通矩阵”

我创建了一个 DocumentTermMatrix,其中包含 1859 个文档(行)和 25722 个文档(列)。为了对该矩阵进行进一步计算,我需要将其转换为常规矩阵。我想…

风苍溪 2024-12-03 21:59:12 5 0

R 文本挖掘包 DocumentTermMatrix 在控制列表中带有字典,占用太多内存

Closed. This question needs details or clarity. It is not currently accepting answers. 想要改进这个问题?通过编辑这篇文章添加详细信息并澄清…

‖放下 2024-11-19 08:50:04 7 0
更多

推荐作者

梦断已成空

文章 0 评论 0

瞎闹

文章 0 评论 0

寄意

文章 0 评论 0

似梦非梦

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文