避免字典查找的高效词形还原器
我想将“吃”之类的字符串转换为“吃”,“吃”。我搜索并找到了词形还原作为解决方案,但我遇到的所有词形还原工具都使用单词列表或字典查找。是否有任何避免字典查找并提供高效率的词形还原器,可能是基于规则的词形还原器。是的,我不是在寻找“词干器”。
I want to convert string like 'eat' to 'eating', 'eats'. I searched and found the lemmatization as the solution, but all the lemmatizer tools that I have come across uses wordlist or dictionary-lookup. Is there any lemmatizer which avoids dictionary lookup and gives high efficiency, may be a lemmatizer that is based on rules. Yes and I am not looking for "stemmer".
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您可以尝试LRBL:基于规则的词形还原器
它使用递归首字母缩略词的概念。
You can try LRBL: a rule-based lemmatizer
It uses the concept of recursive acronyms.