stemming

stemming

文章 0 浏览 1

数据集成问题——如何集成相似的实体

我有一个数据库,在同一个表中有非常相似的行。这些行很相似,因为它们具有几乎相同的列值。我需要将这些相应的行集成到一行中。 例如,这两个用户(u…

旧话新听 2024-10-09 07:56:00 1 0

有没有可用于印度语言的词干分析器

Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …

暖风昔人 2024-09-29 13:11:36 0 0

词库/词干词典

看来我的 Google 功能让我失望了。 有谁知道仅包含单词基础的免费单词基础词典?所以,对于像草莓这样的东西,它就会有草莓。但不包含缩写、拼写错误…

魂牵梦绕锁你心扉 2024-09-29 07:57:22 0 0

PHP 中的 Schinke 拉丁语词干算法

本网站提供“Schinke Latin Stemming Algorithm”下载,以便在Snowball 词干系统。 我想使用这个算法,但我不想使用 Snowball。 好处是:该页面上有一…

海螺姑娘 2024-09-27 12:46:57 0 0

python 中的停用词消除和词干分析器

我有一个有点大的文档,想用 Python 对该文档的单词进行停用词消除和词干处理。有谁知道这些的货架包装吗? 如果没有足够快的代码来处理大型文档也是…

肥爪爪 2024-09-26 12:05:32 1 0

当使用同义词和词干分析时,Solr 能否返回实际使用的最终查询?

我希望能够在我的 UI 中显示 solr 用于运行最终查询的查询术语。例如,我可能会输入查询“run”,但在幕后 solr 将使用词干来查询“ran”和“running…

同尘 2024-09-15 02:20:22 2 0

从文本中提取关键句子

您是否知道一种从文本中提取关键句子及其频率参数等的有效方法,并且还可以进行“词干提取”(也搜索类似的句子)? 我也想知道是否有一些软件实现 非…

花之痕靓丽 2024-08-15 01:50:57 3 0

在 Lucene .Net 中搜索

我使用 Lucene .Net 进行索引,并在索引时使用 StandardAnalyzer。现在我想搜索“附加”。在文件“附件”中有。我如何成功命中“附加”一词。请尽快帮…

和我恋爱吧 2024-08-06 06:23:00 1 0

你能以编程方式检测英语单词的复数形式,并推导出单数形式吗?

给定一些(英语)单词,我们假设它是复数,是否有可能推导出单数形式?如果可能的话,我想避免查找/字典表。 一些例子: Examples -&gt Example a sim…

梦太阳 2024-08-03 15:48:12 6 0

Ruby Lingua::Stem 替代品

是否有 Perl Lingua::Stem 模块的免费替代品,能够处理俄语?谢谢…

小嗷兮 2024-08-03 09:50:00 1 0

为什么 Porter Stemmer 会产生一个可以再次词干的字符串?

茎('苹果')='苹果' 茎('苹果')='appl' 茎('appl')='appl' 这不是词干算法的一个缺陷吗? (这是使用 Porter 词干算法)…

情仇皆在手 2024-08-03 03:39:23 3 0

如何进行词干提取或词形还原?

我尝试过 PorterStemmer 和 Snowball,但两者都不能处理所有单词,缺少一些非常常见的单词。 我的测试词是:“猫跑跑仙人掌仙人掌仙人掌社区社区”,…

_蜘蛛 2024-07-16 23:06:49 4 0

产生真实单词的词干算法

我需要获取一段文本并从中提取“标签”列表。 其中大部分都是非常简单的。 不过,我现在需要一些帮助来阻止生成的单词列表以避免重复。 示例:社区/社…

静水深流 2024-07-06 20:41:29 6 0
更多

推荐作者

不再见

文章 0 评论 0

真是无聊啊

文章 0 评论 0

樱娆

文章 0 评论 0

浅语花开

文章 0 评论 0

烛光

文章 0 评论 0

绻影浮沉

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文