text-mining

text-mining

文章 0 浏览 7

熊猫从列表中找到多个单词,并分配布尔值

因此,我有这样的数据帧, data = { "properties": ["FinancialOffice","Gas Station", "Office", "K-12 School", "Commercial, Office"], } df = pd.…

十级心震 2025-02-13 10:15:57 0 0

将文本块组织为r中的行

我有一个文本文件,其中包含大约1000篇文章的详细信息,每篇文章包含相同的项目(PMC,PMID ..... AID,SO)。我需要将每个文章详细信息作为一行,以…

失退 2025-02-09 08:36:20 1 0

如何在`texplot_xray()`中获取单列答案?

我想对多语言平行语料库进行扫描,以评估可能的等效性。为此,我需要 texplot_xray()才能在单列中返回多个答案。 在第一次搜索中,拉丁语的单词在英…

嘿哥们儿 2025-02-05 05:08:29 3 0

为我们的模型生成歌词时错误

你好!我正在与朋友一起进行小组项目,但是我们正在尝试生成说唱歌词 运行代码时,我们会收到此错误,我们不知道如何修复它。如果您能帮助我们,那将…

音盲 2025-02-04 08:36:19 1 0

R中有没有办法在字符串中找到一定范围内的单词(或句子)的组合

我试图找到所有用单词/句子和其他单词将它们分开但固定限制的单词组合的字符串。 示例:我想要“购买”和“观看”的组合,但最多可以将它们分开2个单…

仅此而已 2025-02-04 02:46:59 4 0

在R中,如何在字符串中找到单词的位置?

如何在数据框单元格中找到特定单词的第一个位置,并将输出保存在同一数据框中的新列中? 理想情况下,我想要字典中每个单词的第一场匹配。 df <- data…

尾戒 2025-02-02 02:09:13 3 0

分裂播放器和聊天日志(文本挖掘)的聊天

我有一个聊天日志,其中包括4个玩家(A,B,C,D)及其数据框中的一排(许多组)。我想将每个短语分为自己的行,并在单独的列中识别该短语的说话者。 …

度的依靠╰つ 2025-02-01 09:26:07 1 0

r情感功能

我对此代码有问题。我找不到错误,但是结果显然是不正确的。调用功能后: data=sentimentfunction(My_tweettext, positive_war, negative_war, .progr…

淡淡離愁欲言轉身 2025-01-29 21:21:33 1 0

如何在()和另一个字符串之间提取字符串

我将R用于文本挖掘,我想在数据框架中计算一些字符串,它们在文本中看起来像这样: “ contionteur(trice)”,“ conducteur.trice”“ conduction.…

懒的傷心 2025-01-27 16:37:29 2 0

不同的单词嵌入方法是否可以在同一数据集中产生相同的词汇。

我想问一下为什么我的嵌入矩阵彼此之间具有不同的维度。 首先,我在IMDB数据集上使用Word2Vec,并在17620年左右生产词汇,而无需使用任何停止单词。其…

独夜无伴 2025-01-26 08:54:42 3 0

在文本文件的不同部分中计算单词

对于一个项目,我必须与Python分析具有200多个简历的TXT文件。我必须搜索文件,并必须计算是否提到了特定键。这是我非常简单的代码: file = open("CV…

意中人 2025-01-26 02:03:08 1 0

检测文本中的预定义主题

我想在文本语料库中找到有关一些预定义主题的典故(假设我对2个主题感兴趣:“报酬”和“工作条件”)。 对于在我的语料库中(特定段落)中的发现,它…

堇色安年 2025-01-25 02:18:27 1 0

在用r刮擦时,可能不会更改URL

我是编程的新手! 我将R用于数据挖掘,我确实在刮擦,并且我的代码正常工作,直到更改URL为止,它给了我这个错误: Error in names(x) <- value : 'na…

胡大本事 2025-01-24 16:12:25 1 0

删除标记之前的数字,标点,白色空间

我从以前的编码帮助中拥有以下数据框架 report <- data.frame(Text = c("unit 1 crosses the street", "driver 2 was speeding and saw driver# 1", "…

离不开的别离 2025-01-23 17:59:56 4 0

如何计算单词/令牌的出现在每一行tibble中

您好,我从 tidytext :: Unnest_tokens()和 count(类别,word,word,name =“ count”)的管道中有一个tibble。看起来这个示例。 owl <- tibble(c…

唐婉 2025-01-20 06:46:44 2 0
更多

推荐作者

梦断已成空

文章 0 评论 0

瞎闹

文章 0 评论 0

寄意

文章 0 评论 0

似梦非梦

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文