jieba 如果筛选一段文字里的tag?

发布于 2021-11-18 18:03:07 字数 296 浏览 856 评论 6

@sunjunyi 你好,想跟你请教个问题:

PSCWS4里面有个函数:get_tops( [int limit [, string attr]] )   根据 send_text 设定的文本内容,返回系统计算出来的最关键词汇列表。 

这个函数我用来“筛选”一段文字里面的tag。

请问jieba有类似的函数么?

谢谢!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(6

冷清清 2021-11-19 05:20:19

非常好

一个人的旅程 2021-11-19 04:59:25

太好了。多谢。

眼眸 2021-11-19 04:58:43

@ sunjunyi 你好,关于github里面的示例代码劳烦您能不能简单讲解一下它的含义 我发了一个求助帖就是关于这个问题的http://www.oschina.net/question/1437095_140621

一个人的旅程 2021-11-19 04:32:43

我刚刚加上了tag提取的功能,还没有正式发布,你可以用github里面的最新啊代码。

用法示例: https://github.com/fxsjy/jieba/blob/master/test/extract_tags.py

成熟的代价 2021-11-19 03:07:59

谢谢。我现在是先分词 然后把一些“冗余词”,比如“的”“了”去掉。呵呵。。。不知道这个可以否?

输什么也不输骨气 2021-11-19 02:25:32

目前还没有提供这个功能,这个需要计算词语的TF/IDF值,然后排序号求最高的几个。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文