请问提取关键字的原理是什么?

发布于 2021-11-18 06:50:10 字数 110 浏览 754 评论 6

请问提取关键字的原理是什么?根据词性?文档tf/idf做什么用呢?

我如何定义自己的关键字词库,比如我需要提取的内容是IT类的信息,我自己有一个IT类的词库,如何加载来提取关键字呢?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(6

辞别 2021-11-25 05:14:14

好像有相关的来源项目,在osc中找分词处理看看

小情绪 2021-11-25 05:10:52

看我github里面有个开源的tire树抽词...就是tree-split

岁吢 2021-11-24 10:48:35

如果我的内容非常短(比如微博),idf找不到相关词语,如何抓内容的关键字(内容中不出现)呢?

千纸鹤带着心事 2021-11-24 01:08:27

你意思是关键字提取和分词是分开实现的吗?二者不依赖?

长安忆 2021-11-23 14:18:49

用treesplit+idf吧..不要用分词...大材小用了...

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文