lemmatization

lemmatization

文章 0 浏览 2

分析文本(词形还原、编辑距离)

我需要分析文本中是否存在禁用词。假设黑名单是单词:“禁止”。这个词有多种形式。在文本中,该词可以是例如:“禁止”、“禁止”、“禁止”。为了将…

千仐 2024-10-29 11:37:06 1 0

使用 DBsight lucene 的动词屈折形式?

我知道 dbsight 允许使用同义词和停用词进行搜索,但这是否也能处理动词的屈折形式,例如,对于“游泳”,它应该找到 Swim、swils、swim、swam 和 swu…

锦欢 2024-08-09 03:05:09 7 0

你能以编程方式检测英语单词的复数形式,并推导出单数形式吗?

给定一些(英语)单词,我们假设它是复数,是否有可能推导出单数形式?如果可能的话,我想避免查找/字典表。 一些例子: Examples -&gt Example a sim…

梦太阳 2024-08-03 15:48:12 11 0

如何进行词干提取或词形还原?

我尝试过 PorterStemmer 和 Snowball,但两者都不能处理所有单词,缺少一些非常常见的单词。 我的测试词是:“猫跑跑仙人掌仙人掌仙人掌社区社区”,…

_蜘蛛 2024-07-16 23:06:49 8 0
更多

推荐作者

linfzu01

文章 0 评论 0

可遇━不可求

文章 0 评论 0

枕梦

文章 0 评论 0

qq_3LFa8Q

文章 0 评论 0

JP

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文