请问提取关键字的原理是什么?
请问提取关键字的原理是什么?根据词性?文档tf/idf做什么用呢?
我如何定义自己的关键字词库,比如我需要提取的内容是IT类的信息,我自己有一个IT类的词库,如何加载来提取关键字呢?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
请问提取关键字的原理是什么?根据词性?文档tf/idf做什么用呢?
我如何定义自己的关键字词库,比如我需要提取的内容是IT类的信息,我自己有一个IT类的词库,如何加载来提取关键字呢?
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(6)
好像有相关的来源项目,在osc中找分词处理看看
同问
看我github里面有个开源的tire树抽词...就是tree-split
如果我的内容非常短(比如微博),idf找不到相关词语,如何抓内容的关键字(内容中不出现)呢?
你意思是关键字提取和分词是分开实现的吗?二者不依赖?
用treesplit+idf吧..不要用分词...大材小用了...