stemming

投稿关注

文章 0 浏览 5

你应该词干化和词形还原吗？

我目前正在使用 python NLTK 来预处理 Kaggle 短信垃圾邮件分类的文本数据数据集。我在预处理过程中完成了以下步骤：删除任何多余的空格删除标点符…

七禾 2025-01-09 17:47:09 0 0

创建 Lucene 分析器

我想做一些基本的希伯来语词干分析。我能找到的所有自定义分析器的示例总是合并其他分析器和过滤器，但它们本身从不进行任何字符串级处理。例如，如…

音栖息无 2024-12-27 06:29:36 0 0

Sphinx 的斯洛文尼亚词干分析器

我正在搜索斯洛文尼亚语的词干算法，我可以将其与 Sphinx 搜索一起使用。我想要实现的目标是，例如，在搜索“jabolka”时，我还想要包含“jabolko”…

神爱温柔 2024-12-24 18:15:25 2 0

Python包在文件/url/字符串中查找预定义的关键字/标签

是否有任何 python 包可以获取关键字/标签列表并将它们与给定的字符串/文件/url 进行匹配？特别是使用词干和/或一些其他同义词匹配方式。即我预先保…

习惯成性 2024-12-19 05:31:40 2 0

Lucene SpanishAnalyzer 类带有重音词的奇怪行为

我在 Lucene 3.4 中使用SpanishAnalyzer 类。当我想解析带重音的单词时，我得到了一个奇怪的结果。例如，如果我解析这两个单词：“comunicación”和“…

转角预定愛 2024-12-18 01:37:40 2 0

如何使用R语言tm（文本挖掘）包中的stemDocument？

我正在尝试使用调用Java的R语言tm包中的stemDocument来阻止语料库。我已经尝试了 tm 手册中的示例： data("crude") crude[[1]] stemDocument(crude[[…

你与清晨阳光 2024-12-07 07:09:05 2 0

Lucene 同义词扩展、词干、拼写检查等

我正在使用 Lucene 来索引我的数据库，然后对特定字段（字段名称：关键字）执行短语搜索。我当前正在使用以下代码： String userQuery = request.get…

反差帅 2024-11-29 11:07:12 5 0

如何使用 PHP 减少数组中包含的相似短语的数量？

我有一个包含短语（几个到数百个）的数组。示例： adhesive materials adhesive material material adhesive adhesive applicator adhesive applicat…

寂寞花火° 2024-11-29 08:01:48 2 0

避免 Solr 由于词干而缓慢突出显示

我对使用 Solr 还很陌生，但想寻求您的帮助。我正在开发一个应用程序，它应该能够突出显示查询结果。为此，我使用正则表达式分段器： 500 0.5 ]]> ]]…

a√萤火虫的光℡ 2024-11-27 03:13:31 4 0

R 中的基本词干提取代替根词干提取

有没有什么方法可以在 R 中使用 NLP 来获取词干而不是根词？代码： > #Loading libraries > library(tm) > library(slam) > > #Vector > Vec=c("happ…

银河中√捞星星 2024-11-20 00:41:28 7 0

如何获取同义词集的所有属性？

请给我一个示例，其中包含单词的 synset 的所有属性我只知道这个属性： name 、 lemma_names 、 definition synsetsWord = ObjWn.synsets( 'Book' ) …

深海蓝天 2024-11-19 23:04:15 5 0

在 NLTK 中导入 WordNet

我想导入 wordnet 字典，但是当我导入字典表单 wordnet 时，我看到此错误： for l in open(WNSEARCHDIR+'/lexnames').readlines(): IOError: [Errno 2…

丘比特射中我 2024-11-19 14:34:23 11 0

Nltk 中的 WordNetLemmatizer 可以词干吗？

我想使用 Wordnet 查找词干。 wordnet 有词干提取功能吗？我使用此导入进行词干提取，但它没有按预期工作。 from nltk.stem.wordnet import WordNetL…

゛清羽墨安 2024-11-19 07:49:32 7 0

是否有克罗地亚语词干算法的实现？

我正在寻找克罗地亚语词干算法的实现。理想情况下使用 Java，但我也接受任何其他语言。是否有一个讲英语的开发人员社区正在开发克罗地亚语的搜索应用…

牵你手 2024-11-17 11:35:53 5 0

Solr 中的精确单词搜索

我有一个与这个问题密切相关的问题。在我的模式中，我有一个字段这给出了完全匹配，即。词干禁用吃=吃是否可以，同时配置为textgen来搜索该词的其…

口干舌燥 2024-11-16 09:29:00 5 0

共 3 页
1
2
3
下一页

友情链接

文江博客