stemming

stemming

文章 0 浏览 5

你应该词干化和词形还原吗?

我目前正在使用 python NLTK 来预处理 Kaggle 短信垃圾邮件分类的文本数据数据集。我在预处理过程中完成了以下步骤: 删除任何多余的空格 删除标点符…

七禾 2025-01-09 17:47:09 0 0

创建 Lucene 分析器

我想做一些基本的希伯来语词干分析。 我能找到的所有自定义分析器的示例总是合并其他分析器和过滤器,但它们本身从不进行任何字符串级处理。 例如,如…

音栖息无 2024-12-27 06:29:36 0 0

Sphinx 的斯洛文尼亚词干分析器

我正在搜索斯洛文尼亚语的词干算法,我可以将其与 Sphinx 搜索一起使用。 我想要实现的目标是,例如,在搜索“jabolka”时,我还想要包含“jabolko”…

神爱温柔 2024-12-24 18:15:25 2 0

Python包在文件/url/字符串中查找预定义的关键字/标签

是否有任何 python 包可以获取关键字/标签列表并将它们与给定的字符串/文件/url 进行匹配? 特别是使用词干和/或一些其他同义词匹配方式。 即我预先保…

习惯成性 2024-12-19 05:31:40 2 0

Lucene SpanishAnalyzer 类带有重音词的奇怪行为

我在 Lucene 3.4 中使用SpanishAnalyzer 类。当我想解析带重音的单词时,我得到了一个奇怪的结果。例如,如果我解析这两个单词:“comunicación”和“…

转角预定愛 2024-12-18 01:37:40 2 0

如何使用R语言tm(文本挖掘)包中的stemDocument?

我正在尝试使用调用Java的R语言tm包中的stemDocument来阻止语料库。 我已经尝试了 tm 手册中的示例: data("crude") crude[[1]] stemDocument(crude[[…

你与清晨阳光 2024-12-07 07:09:05 2 0

Lucene 同义词扩展、词干、拼写检查等

我正在使用 Lucene 来索引我的数据库,然后对特定字段(字段名称:关键字)执行短语搜索。 我当前正在使用以下代码: String userQuery = request.get…

反差帅 2024-11-29 11:07:12 5 0

如何使用 PHP 减少数组中包含的相似短语的数量?

我有一个包含短语(几个到数百个)的数组。 示例: adhesive materials adhesive material material adhesive adhesive applicator adhesive applicat…

寂寞花火° 2024-11-29 08:01:48 2 0

避免 Solr 由于词干而缓慢突出显示

我对使用 Solr 还很陌生,但想寻求您的帮助。 我正在开发一个应用程序,它应该能够突出显示查询结果。为此,我使用正则表达式分段器: 500 0.5 ]]> ]]…

a√萤火虫的光℡ 2024-11-27 03:13:31 4 0

R 中的基本词干提取代替根词干提取

有没有什么方法可以在 R 中使用 NLP 来获取词干而不是根词? 代码: > #Loading libraries > library(tm) > library(slam) > > #Vector > Vec=c("happ…

银河中√捞星星 2024-11-20 00:41:28 7 0

如何获取同义词集的所有属性?

请给我一个示例,其中包含单词的 synset 的所有属性 我只知道这个属性: name 、 lemma_names 、 definition synsetsWord = ObjWn.synsets( 'Book' ) …

深海蓝天 2024-11-19 23:04:15 5 0

在 NLTK 中导入 WordNet

我想导入 wordnet 字典,但是当我导入字典表单 wordnet 时,我看到此错误: for l in open(WNSEARCHDIR+'/lexnames').readlines(): IOError: [Errno 2…

丘比特射中我 2024-11-19 14:34:23 11 0

Nltk 中的 WordNetLemmatizer 可以词干吗?

我想使用 Wordnet 查找词干。 wordnet 有词干提取功能吗? 我使用此导入进行词干提取,但它没有按预期工作。 from nltk.stem.wordnet import WordNetL…

゛清羽墨安 2024-11-19 07:49:32 7 0

是否有克罗地亚语词干算法的实现?

我正在寻找克罗地亚语词干算法的实现。理想情况下使用 Java,但我也接受任何其他语言。 是否有一个讲英语的开发人员社区正在开发克罗地亚语的搜索应用…

牵你手 2024-11-17 11:35:53 5 0

Solr 中的精确单词搜索

我有一个与这个问题密切相关的问题。 在我的模式中,我有一个字段 这给出了完全匹配,即。词干禁用 吃=吃 是否可以,同时配置为textgen来搜索该词的其…

口干舌燥 2024-11-16 09:29:00 5 0
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文