Jieba

Jieba

文章 15 浏览 251

中文分词的语料库中的词是如何的生成的?

我有多篇关于汽车类的文章,文章中多次提到"本田雅阁"关键词,再语料库中没有该词语的情况下分词,会被切分成"本田" / "雅阁",怎么在不使用人工添加情况…

伪装你 2022-01-06 10:29:02 961 0

linux下使用jieba不能看到输出结果

@sunjunyi 你好,想跟你请教个问题:我在linux下运行结巴时不能输出分词结果,只输出了&ltgenerator object cut at 0x8b0d914&gt,这是什么原因? …

平生欢 2021-12-08 15:16:33 668 0

结巴有php版的吗?

@sunjunyi 你好,想跟你请教个问题:结巴有php版的吗? …

霞映澄塘 2021-12-04 20:08:14 966 0

结巴分词自定义字典起不到分词效果

@sunjunyi 你好,想跟你请教个问题:我现在自定义词典后,每次load后起不到作用而且运行总是这样的错误: 这是什么原因呢,另外的我字典格式类似于,…

坚持沉默 2021-11-28 12:59:27 667 0

jieba分词的Tokenize函数可以实现词性标注功能么?

@sunjunyi 你好,想跟你请教个问题:我看到结巴分词的Tokenize函数,觉得非常实用。如果再加上对词性的支持,那就更棒了。想请教一下是否已有此功能…

执手闯天涯 2021-11-25 04:54:51 750 0

结巴安装问题(ubuntu13+python3)

@sunjunyi 你好,想跟你请教个问题: 我是unbuntu13.04, python3, 按照网页上的命令装, 第一步:git clone https://github.com/fxsjy/jieba.git 没…

白龙吟 2021-11-24 21:31:57 680 0

关于并行分词的使用问题

@sunjunyi 你好,想跟你请教个并行分词的使用问题: 主页上说并行分词“将目标文本按行分隔后,把各行文本分配到多个python进程并行分词,然后归并结…

如日中天 2021-11-20 21:59:01 842 0

jieba 如果筛选一段文字里的tag?

@sunjunyi 你好,想跟你请教个问题: PSCWS4里面有个函数:get_tops( [int limit [, string attr]] ) &nbsp&nbsp根据 send_text 设定的文本内容,返回…

柳絮泡泡 2021-11-18 18:03:07 852 0

jieba分词怎么用?我是小白,怎么导入需要分析的文本.提取关键词,输出?

怎么导入要分析的词语文本,(很多句子的)。- 分词-怎么提取 关键词。怎么导出? 导入文本-》分词-》提取关键词-》导出文本. 能给个脚本吗? 小白,…

终陌 2021-11-18 12:25:19 766 0

import jieba报错

@sunjunyi 你好,想跟你请教个问题: 我刚开始接触jieba,引入import jieba,报错: File "/usr/lib/python2.4/site-packages/jieba/__init__.py", li…

输什么也不输骨气 2021-11-18 09:37:32 907 0

jieba 词性标注是怎么实现的?

@sunjunyi 你好,想跟你请教个问题: 1. 最近在做分词相关的工作,看到jieba支持词性标注,不知道是怎么实现的? 2. 反观java的实现方式,你的代码量…

长安忆 2021-11-15 20:02:48 859 0

结巴分词怎么增加一些专业词汇

结巴分词的怎么增加自己的词,电子商务有很多自己的专业词汇,想增加自己的词的怎么添加…

流心雨 2021-11-15 10:36:30 936 0

怎么删除jieba自带的词库,换上自己的词库

如题:这里有领域专业词组,原来的词用不上,怎么替换?…

皇甫轩 2021-11-13 01:58:52 853 0
更多

推荐作者

qq_Yqvrrd

文章 0 评论 0

2503248646

文章 0 评论 0

浮生未歇

文章 0 评论 0

养猫人

文章 0 评论 0

第七度阳光i

文章 0 评论 0

新雨望断虹

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文