模式匹配中的 SPACY 否定运算符

发布于 2025-01-16 18:50:59 字数 722 浏览 1 评论 0原文

我正在尝试在 spaCy 中编写一个与“黑色”匹配但不与“黑豆”匹配的模式。

我尝试了下面的代码，但它似乎与“black”旁边的标记匹配，只要它不是“bean”。如何修改以仅匹配“黑色”？

nlp = spacy.load("en_core_web_sm")
matcher = Matcher(nlp.vocab)

#pattern = [{"LOWER": "black"}, {"LEMMA": {"NOT_IN": ["bean", "beans"]}}]
pattern = [{"LOWER": "black"}, {"LEMMA": "bean", "OP": "!"}]
matcher.add("blackbeans", [pattern])

doc = nlp("I liked the black beans, but the avocado was black making the whole meal blackish-looking and not good.")

matches = matcher(doc)
for match_id, start, end in matches:
    string_id = nlp.vocab.strings[match_id]  # Get string representation
    span = doc[start:end]  # The matched span
    print(match_id, string_id, start, end, span.text)

原文

I am trying to write a pattern in spaCy that matches against "black" but not "black beans."

I tried the code below, but it seems to match the token that is next to "black" so long as it is not "bean." How do I modify to match against only "black"?

nlp = spacy.load("en_core_web_sm")
matcher = Matcher(nlp.vocab)

#pattern = [{"LOWER": "black"}, {"LEMMA": {"NOT_IN": ["bean", "beans"]}}]
pattern = [{"LOWER": "black"}, {"LEMMA": "bean", "OP": "!"}]
matcher.add("blackbeans", [pattern])

doc = nlp("I liked the black beans, but the avocado was black making the whole meal blackish-looking and not good.")

matches = matcher(doc)
for match_id, start, end in matches:
    string_id = nlp.vocab.strings[match_id]  # Get string representation
    span = doc[start:end]  # The matched span
    print(match_id, string_id, start, end, span.text)

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

冷弦 2025-01-23 18:50:59

没有办法做到这一点 - 匹配器返回输入模式描述的每个标记。否定模式也不匹配非标记，因此如果“black”是句子中的最后一个标记，则您的模式将失败。

有几种方法可以解决此问题：

您始终可以匹配“黑色”并对匹配进行后处理。这非常简单，尽管有些人不喜欢它，因为它不使用匹配器。
您可以使用对齐功能匹配器，它告诉您每个标记匹配模式的哪一部分。这主要适用于比您现在使用的模式更复杂的模式。

回复收藏 0 原文

幸福还没到 2025-01-23 18:50:59

pattern = [{"LOWER": "black"}, {"LOWER": {"NOT_IN": ["bean", "beans"]}, "OP" : "?"}]

pattern = [{"LOWER": "black"}, {"LOWER": {"NOT_IN": ["bean", "beans"]}, "OP" : "?"}]

回复收藏 0 原文

~没有更多了~

关于作者

a√萤火虫的光℡

暂无简介

文章

25 人气

关注发私信

十二

文章 0 评论 0

关注

飞烟轻若梦

文章 0 评论 0

关注

OPleyuhuo

文章 0 评论 0

关注

wxb0109

文章 0 评论 0

关注

旧城空念

文章 0 评论 0

关注

-小熊_

文章 0 评论 0

友情链接

文江博客

模式匹配中的 SPACY 否定运算符

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

模式匹配中的 SPACY 否定运算符

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。