lemmatization

lemmatization

文章 0 浏览 6

如何创建一个词典,其键:值对是两个不同字典列表的值?

我有2个由pymongo提取导致的字典列表。 包含ID(字符串)和引理(字符串)的DICT的列表: lemmas = [{'ID':'ID1','lemma':'lemma1'},{'id'':'id2…

香橙ぽ 2025-02-13 16:40:38 1 0

更快的python lemmatization

我一直在测试不同的柠檬酸方法,因为它将用于非常大的语料库。以下是我的方法和结果。有人有任何提示加快这些方法的提示吗? Spacy是最快的,其中包括…

歌入人心 2025-02-09 19:35:20 0 0

在python的数据框中窃听动词列表

我想问一个看似简单的问题,向python wizs(我是一个新手,所以不知道这个问题有多简单/复杂)! 我在数据框中有一个动词列表,如下所示: id动词 15…

月野兔 2025-02-01 12:33:01 2 0

Stemmer和Lemmatizer似乎都无法正常工作,我该怎么办?

我是文本分析的新手,并且正在尝试创建一袋单词模型(使用Sklearn's CountVectorizer方法)。我有一个带有文本列的数据框,上面有“酸”,“酸性”,…

请远离我 2025-01-29 09:10:52 7 0

为什么我的话语lemmatization无法正常工作?

嗨,Stackoverflow社区! 长期读者,但首次海报。我目前正在尝试NLP的手,并且在阅读了一些有关此主题的论坛帖子后,我似乎无法让Lemmatizer正常工作…

谎言月老 2025-01-26 09:18:15 2 0

词干提取和旅鼠词

Closed. This question needs debugging details. It is not currently accepting answers. 编辑问题以包含所需行为、特定问题或错误以及重现问题所…

爱已欠费 2025-01-17 08:18:44 4 0

使用 str.isnumeric() 从列表中打印数字时出现问题

我试图构建一个接收数据帧列的函数,对其进行词形化并仅返回数字,由于某种原因,我在使用 str.isnumeric() 方法时遇到困难,每当我尝试使用它时,我…

墨洒年华 2025-01-11 20:10:20 2 0

你应该词干化和词形还原吗?

我目前正在使用 python NLTK 来预处理 Kaggle 短信垃圾邮件分类的文本数据数据集。我在预处理过程中完成了以下步骤: 删除任何多余的空格 删除标点符…

七禾 2025-01-09 17:47:09 5 0

为什么 NLTK 的 Wordnet 词形还原器不对副词和形容词进行词形还原?

据我所知,如果我们识别每个标记对应的 PoS 标签,然后通过设置参数不仅对动词、名词进行词形还原,而且对形容词和副词形式进行词形还原,则可以在词…

肤浅与狂妄 2025-01-09 16:38:04 3 0

避免字典查找的高效词形还原器

我想将“吃”之类的字符串转换为“吃”,“吃”。我搜索并找到了词形还原作为解决方案,但我遇到的所有词形还原工具都使用单词列表或字典查找。是否有…

一个人的旅程 2024-12-20 12:14:12 4 0

使用 wordnet 获取单词的引理

如何使用 Wordnet 获取给定单词的引理。我似乎无法在 wordnet 文档中找到我想要的内容。 http://wordnet.princeton.edu/wordnet/man/wn.1WN.html 例如…

哑剧 2024-11-25 16:29:20 9 0

Nltk 中的 WordNetLemmatizer 可以词干吗?

我想使用 Wordnet 查找词干。 wordnet 有词干提取功能吗? 我使用此导入进行词干提取,但它没有按预期工作。 from nltk.stem.wordnet import WordNetL…

゛清羽墨安 2024-11-19 07:49:32 12 0

分析文本(词形还原、编辑距离)

我需要分析文本中是否存在禁用词。假设黑名单是单词:“禁止”。这个词有多种形式。在文本中,该词可以是例如:“禁止”、“禁止”、“禁止”。为了将…

千仐 2024-10-29 11:37:06 11 0

使用 DBsight lucene 的动词屈折形式?

我知道 dbsight 允许使用同义词和停用词进行搜索,但这是否也能处理动词的屈折形式,例如,对于“游泳”,它应该找到 Swim、swils、swim、swam 和 swu…

锦欢 2024-08-09 03:05:09 18 0

你能以编程方式检测英语单词的复数形式,并推导出单数形式吗?

给定一些(英语)单词,我们假设它是复数,是否有可能推导出单数形式?如果可能的话,我想避免查找/字典表。 一些例子: Examples -> Example a simpl…

梦太阳 2024-08-03 15:48:12 20 0
更多

推荐作者

十二

文章 0 评论 0

飞烟轻若梦

文章 0 评论 0

OPleyuhuo

文章 0 评论 0

wxb0109

文章 0 评论 0

旧城空念

文章 0 评论 0

-小熊_

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文