为KWIC DF节省docvars吗?
有没有办法将docvars保存到KWIC输出数据框架?我想保存docvars,例如日期和文档标题。我已经阅读了 https://github.com/quanteda/quanteda/quanteda/…
Quanteda DFM_Weight()导致相对频率> 1
我正在使用Quanteda,并试图计算由日期和政党组织的语料库中特定单词的相对频率。但是,将语料库转换为dfm并使用dfm_weight(dfmat,scheme =“ prop…
如何在Quanteda Pipeline中使用定制令牌
我想根据Quanteda Pipeline df%>%colpus()%>%tokens()%>%dfm() df%>%dfm()。 但是我无法做到这一点... 一个例子: d…
使用 quanteda r 从 dfm 获取零 tf_idf
我想创建一个以 tf_idf 作为权重的文档特征矩阵。如果我像 https://quanteda.io/reference/dfm_tfidf.html 中那样计算 tf_idf ,我只得到零。如果我尝…
Quanteda:显示文本之间的实际差异
我设法用余弦方法计算两个文本之间的差异。通过以下内容: library("quanteda") dfmat % tokens(remove_punct = TRUE) %>% tokens_remove(stopwords("…
从语料库中删除特定单词
在此过程之后,如何从 myDfm 语料库中删除特定单词? dflemma <- spacy_parse(structure(df2$term, names = df2$id), lemma = TRUE, pos = FALSE) %>%…
- 共 1 页
- 1