查找同义词和倾斜词的基本形式
我正在寻找一个 Java 工具,它可以让我执行以下操作:
1)查找倾斜单词的基本形式。示例:
- 对于单词“connection”、“connecting”、“connects”等,它将返回单词“connect”。
- 对于单词“running”,“runs”它将返回单词“run”。
2)返回每个单词的同义词集合。
有人知道这样的工具吗?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我猜你只关心英语。
您遇到的第一个问题称为词干。这篇 SO post 推荐了 Porter Stemmer。
WordNet 有一个相当大的人类创建/管理的单词及其关系数据库,其中包括同义词等。这是 WordNet 的 Java API。
I assume you care only about English.
The first problem you have is called stemming. This SO post recommends this Java implementation of the Porter stemmer.
WordNet has a pretty big human created/curated database of words and their relations that includes synonyms among other things. Here is a Java API to WordNet.