如何检测两篇新闻文章是否具有相同的主题? (Python语义相似度)
我正在尝试从一些特定网站上的文章中抓取标题和正文,类似于谷歌对谷歌新闻的做法。 问题是,在不同的网站上,他们可能有关于同一主题的文章,措辞略…
从java程序调用Stanford POS Tagger maxentTagger
我是斯坦福 POS 标记器的新手。 我需要从我的 java 程序调用标记器并将输出定向到文本文件。 我已经从Stanford-postagger 中提取了源文件并尝试调用ma…
vim 是否能够检测文件的自然语言,然后加载正确的字典?
我正在使用多种语言,目前我必须向 vim 指示必须使用其中哪种语言进行拼写检查。有没有一种方法可以设置 vim 以便它自动检测正确的?我依稀记得在vim…
语言查询和字数统计开源库 (LIWC)
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …
数据清理:是否有我们可以使用的常见排列库?或者有更好的方法吗?
我们正在致力于清理和分析大量人工输入的客户数据。我们需要以编程方式确定两个地址(例如)是否相同,即使输入的数据略有不同。 现在,我们通过相当…
简单NLP:如何使用ngram做单词相似度?
我听说 google 使用最多 7-gram 来进行语义相似性比较。我有兴趣找到上下文中相似的单词(即猫和狗),并且我想知道如何在 n 元语法模型上计算两个单…