Python包在文件/url/字符串中查找预定义的关键字/标签

发布于 2024-12-19 05:31:40 字数 432 浏览 1 评论 0原文

是否有任何 python 包可以获取关键字/标签列表并将它们与给定的字符串/文件/url 进行匹配?

特别是使用词干和/或一些其他同义词匹配方式。

即我预先保存的关键字:

Ski, 自行车, 爬

我的文字:

在山里滑雪很棒

应该标记为滑雪

滑雪和山地自行车很有趣

应该标记为SkiBike

如果我有一个同义词文件将 Bike 映射到 MTB

MTB 就是一个很好的方式来度过day

应该标记为Bike

Are there any python packages that can take a list of keywords / tags and match them up to a given string / file / url ?

Specifically using stemming and/or some other synonym way of matching.

i.e. my pre saved keywords:

Ski,
Bike,
Climb

my text:

Skiing in the mountains is great

Should get tagged with Ski

Skiing and mountain biking is fun

Should get tagged with Ski And Bike

And if I've got a synonyms file somewhere mapping Bike to MTB

MTB is a great way to spend the day

Should get tagged Bike

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

归属感 2024-12-26 05:31:40

请参阅 同义词库(您也可以尝试不同的模块,例如 同义词模块)。

您还可以使用 in 测试句子是否包含特定字符串:

>>> 'Ski' in 'Skiing in the mountains is great'
True
>>> 'Bike' in 'Skiing in the mountains is great'
False

See Thesaurus (you can also try different modules, such as synonym module).

Also you can test sentences for containing specific strings using in:

>>> 'Ski' in 'Skiing in the mountains is great'
True
>>> 'Bike' in 'Skiing in the mountains is great'
False
微暖i 2024-12-26 05:31:40

我不知道有什么包可以做到这一点,但实际上使用普通的 python 非常简单。使用 re (regex) 标准包。类似的东西

import re
key_words =['ski','bike','climb'] 
input = "Skiing and mountain biking is fun"

input_words = input.split()#split on space
[word.lower() for word in input_words]
input_tags =[]
for word in input_words:
   for key in key_words:
      if re.search(key,word):
         input_tags.append(key)

I don't know any package to do that but actually this is very simple with plain python. using re (regex) standard package. something like

import re
key_words =['ski','bike','climb'] 
input = "Skiing and mountain biking is fun"

input_words = input.split()#split on space
[word.lower() for word in input_words]
input_tags =[]
for word in input_words:
   for key in key_words:
      if re.search(key,word):
         input_tags.append(key)
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文