如何使用python中的npl或spacy在句子中仅删除含义较少的单词示例:fvbfxcfbs,#$%$#$$ ## $,sdhsjkbnfsgfdf

发布于 2025-01-28 03:08:06 字数 626 浏览 3 评论 0原文

import nltk
from nltk import word_tokenize

words = set(nltk.corpus.words.words())
sent = 'my name is vallem balu fvbfxcfbs gvcx 2124326456 4554 @#@%$@!%^$#@%$ from Andhra Pradesh i was working software engineer'

data=''.join(e for e in sent if (e.isalnum() or e.isspace()))
print(data)
sent =" ".join(w for w in nltk.wordpunct_tokenize(str(data)) \
         if w.lower() in words or not w.isalpha())
print(sent)

输出:

我的名字叫Vallem Balu fvbfxcfbs GVCX 2124326456 4554来自安得拉邦,我是在工作软件工程师,

我的名字是Balu 2124326456 4554,我从我开始工作的工程师

如何在下面完成完整句子: 我的名字叫Vallem Balu 2124326456 4554来自安得拉邦

import nltk
from nltk import word_tokenize

words = set(nltk.corpus.words.words())
sent = 'my name is vallem balu fvbfxcfbs gvcx 2124326456 4554 @#@%$@!%^$#@%$ from Andhra Pradesh i was working software engineer'

data=''.join(e for e in sent if (e.isalnum() or e.isspace()))
print(data)
sent =" ".join(w for w in nltk.wordpunct_tokenize(str(data)) \
         if w.lower() in words or not w.isalpha())
print(sent)

output:

my name is vallem balu fvbfxcfbs gvcx 2124326456 4554 from Andhra Pradesh i was working software engineer

my name is balu 2124326456 4554 from i was working engineer

how to get below full sentence:
my name is vallem balu 2124326456 4554 from Andhra Pradesh i was working software engineer

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文