Python包在文件/url/字符串中查找预定义的关键字/标签
是否有任何 python 包可以获取关键字/标签列表并将它们与给定的字符串/文件/url 进行匹配?
特别是使用词干和/或一些其他同义词匹配方式。
即我预先保存的关键字:
Ski, 自行车, 爬
我的文字:
在山里滑雪很棒
应该标记为滑雪
滑雪和山地自行车很有趣
应该标记为Ski
和 Bike
如果我有一个同义词文件将 Bike
映射到 MTB
MTB 就是一个很好的方式来度过day
应该标记为Bike
Are there any python packages that can take a list of keywords / tags and match them up to a given string / file / url ?
Specifically using stemming and/or some other synonym way of matching.
i.e. my pre saved keywords:
Ski,
Bike,
Climb
my text:
Skiing in the mountains is great
Should get tagged with Ski
Skiing and mountain biking is fun
Should get tagged with Ski
And Bike
And if I've got a synonyms file somewhere mapping Bike
to MTB
MTB is a great way to spend the day
Should get tagged Bike
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
请参阅
同义词库
(您也可以尝试不同的模块,例如同义词
模块)。您还可以使用
in
测试句子是否包含特定字符串:See
Thesaurus
(you can also try different modules, such assynonym
module).Also you can test sentences for containing specific strings using
in
:我不知道有什么包可以做到这一点,但实际上使用普通的 python 非常简单。使用 re (regex) 标准包。类似的东西
I don't know any package to do that but actually this is very simple with plain python. using re (regex) standard package. something like