没有 pos 的句子 - Python

发布于 2025-01-18 15:35:40 字数 346 浏览 5 评论 0原文

我已经对文本进行了标记，并希望在没有 pos 的情况下打印句子的错误，但它会为每个句子打印错误。我应该如何改变它？

sents = nltk.sent_tokenize(text)

for sent in sents:
    tokens = nltk.word_tokenize(sent)
    tagged = nltk.pos_tag(tokens)
    
    for pos in tagged:        
        if 'VB' not in sents :
             print('error')

原文

I have tokenized the text and want to print error for the sentences without a pos but it prints error for every single sentence. How should I change it?

sents = nltk.sent_tokenize(text)

for sent in sents:
    tokens = nltk.word_tokenize(sent)
    tagged = nltk.pos_tag(tokens)
    
    for pos in tagged:        
        if 'VB' not in sents :
             print('error')

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

路弥 2025-01-25 15:35:40

text = "this sentence has verb. this one not"
sents = nltk.sent_tokenize(text)

for sent in sents:
    has_verb = False
    tokens = nltk.word_tokenize(sent)
    pos_tags = nltk.pos_tag(tokens)
    for pos_tag in pos_tags:        
        if 'VB' in pos_tag[1] :
            has_verb=True
            break
    if not has_verb:
        print(f'error: "{sent}" does not have verb')

text = "this sentence has verb. this one not"
sents = nltk.sent_tokenize(text)

for sent in sents:
    has_verb = False
    tokens = nltk.word_tokenize(sent)
    pos_tags = nltk.pos_tag(tokens)
    for pos_tag in pos_tags:        
        if 'VB' in pos_tag[1] :
            has_verb=True
            break
    if not has_verb:
        print(f'error: "{sent}" does not have verb')

回复收藏 0 原文

素罗衫 2025-01-25 15:35:40

正如@baileythegreen指出的那样，以为您的最后一个条件仅在标记秘诀之后，如果不是sents：正在检查整个标记文本。
即使您正在迭代的迭代中，每个迭代都会返回，其中包含“ vb”标签。
您可能应该使用标志Eg eg has_vb = false，并且条件应为，如果未在标记[1]中'vb'：has_vb = true
如果has_vb：print（error），for循环完成后