关于#开发语言#的问题:NLP如何对提取出来的新词进行词向量的过滤

发布于 2022-09-13 00:55:46 字数 94 浏览 27 评论 0

NLP如何对提取出来的新词进行词向量的过滤?就是提取出来的新词可能什么方向的都有,我只需要其中某个领域的,比如医疗相关的。如何能实现对新词的一个过滤,进一步去除不相连的新词。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

假面具 2022-09-20 00:55:46

word2vec 了解一下

然后看医疗领域值大于0.5,就算这个新词成功上岸

已参与 「极客观点」 ,欢迎正在阅读的你也加入。

情释 2022-09-20 00:55:46

NLP文本处理:词的过滤(Words Filtering)【停用词、低频词】

import nltk
from nltk.corpus import stopwords
stopset = set(stopwords.words('english'))
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文