为什么这些词被视为停用词？

发布于 2024-11-17 05:17:01 字数 1199 浏览 7 评论 0原文

我没有自然语言处理的正式背景，想知道 NLP 方面的人是否可以对此有所了解。我正在使用 NLTK 库，并且专门研究了此包提供的停用词功能：

在[80]中： nltk.corpus.stopwords.words('english')
输出[80]：
['我', '我', '我的', '我自己'，'我们'，'我们的'，'我们的'， ‘我们自己’、‘你们’、‘你们的’、 '你的'，'你自己'，'你们自己'， '他'，'他'，'他的'，'他自己'， ‘她’，‘她’，‘她的’，‘她自己’， '它'，'它'，'它自己'，'他们'， '他们'，'他们的'，'他们的'， '他们自己'，'什么'，'哪个'， ‘谁’、‘谁’、‘这个’、‘那个’、 '这些'，'那些'，'是'，'是'， '是'，'是'，'是'，'是'， '曾经'、'正在'、'有'、'有'、 '有'、'有'、'做'、'做'、 '做了'、'做'、'一个'、'一个'、'那个'、 '并且'、'但是'、'如果'、'或者'、 '因为'、'作为'、'直到'、'同时'、 “的”、“在”、“通过”、“为”、“与”、 '关于'、'反对'、'之间'、 '进入'、'通过'、'期间'、 “之前”、“之后”、“之上”、 “下方”、“至”、“自”、“上方”、 ‘下’、‘进’、‘出’、‘开’、‘关’、 “之上”、“之下”、“再次”、 '进一步'，'然后'，'曾经'，'这里'， ‘那里’、‘何时’、‘何处’、‘为什么’、 “如何”、“全部”、“任何”、“两者”、 '每个'，'很少'，'更多'，'大多数'， '其他'，'一些'，'这样'，'不'， '也不'、'不'、'仅'、'拥有'、 '相同'、'所以'、'比'、'也是'、 '非常'、's'、't'、'能够'、'将会'、 '只是'，'不要'，'应该'，'现在']

我不明白的是，为什么出现“不”这个词？难道不需要确定句子中的情感吗？例如，这样一句话：