Jcseg

Jcseg

文章 54 浏览 79

关于词性null的疑问?

@狮子的魂 你好,想跟你请教个问题: 用了自带的词库分词后,绝大部分词的词性都是null,这个怎么解决?人工添加? …

最偏执的依靠 2021-11-28 02:46:27 935 0

jcseg与solr集成如何获取solr正在使用的词库实例

@狮子的魂jcseg想与solr做集成,在开发文档中有:2. 获取正在工作的 ADictionary 实例:      给solr 的 JcsegTokenizerFactory 可以通过对应对象的get…

奢望 2021-11-27 17:35:42 781 0

autoload bug

@狮子的魂 你好,想跟你请教个问题:我本想使用autoload 功能,修改jcseg.properties autoload=1 但是并没有生效,通过观察源码发现ADictionary:85 ,…

飘过的浮云 2021-11-27 15:41:10 885 0

jcseg代码无法运行测试代码

@狮子的魂 你好,想跟你请教个问题: 我按照如下代码测试查询, 系统抛出异常, 想请教下原因: @Test     public void testSearch2() throws Exception…

明媚如初 2021-11-27 15:35:14 905 0

简体 转 繁体 不准确

我使用DicConvert工具进行词库的简繁转换。 转换后,简体词库中的133769行的“节奏”转换成了“薌奏” 节奏 ---> 薌奏 而正确的转换应该为: 节奏 --…

深巷少女 2021-11-27 10:26:01 880 0

请问DETECT_MODE模式怎么获取词汇在整篇文章的位置信息呢

@狮子的魂 你好,想跟你请教个问题:我用下面代码 while ((word = seg.next()) != null) { if(word.getLength()>=4){System.out.println(word.getVal…

断爱 2021-11-27 06:53:13 774 0

jcseg的同义词支持好像有点问题。

@狮子的魂 你好,想跟你请教个问题:jcseg的同义词支持好像有点问题。S01E01这个表示第一季第一集,美剧一般是这样分集的。我想实现 S01的同义词为 …

成熟的代价 2021-11-27 06:36:21 723 0

jcseg 高亮问题

@狮子的魂 你好,想跟你请教个问题: 安装了 jcseg 后,把原本的 mmseg4j 换成你的之后,重新推内容到索引,效果不错,不过在增加了高亮后,"duowan"…

白龙吟 2021-11-26 20:46:40 893 0

Solr 中 jcseg.properties配置文件路径问题

你好lion soul,我使用最新的jcseg1.9.4版本,应用到Solr4.X中,容器是Tomcat 我按照文档的说明: 1. 从jcseg附件解压目录中将jcseg-core-1.9.4.jar和…

因为看清所以看轻 2021-11-26 12:44:43 844 0

停用词中如何添加回车、换行、制表符等?

@狮子的魂 你好,想跟你请教个问题:在 jcseg 停用词库中,如何添加回车(r)、换行(n)、制表符(t)等特殊字符呢? …

奢望 2021-11-26 05:32:52 817 0

请问分词器的字典在搜索引擎中起什么作用

我用jcseg切分大段中文放入elasticsearch,发现即使字典没有的词一样可以搜索出来。使用match_phrase能完全匹配。  如词“南阳县旅游”这个词,切分…

终止放荡 2021-11-25 22:57:42 886 0

基于jcseg的拼音修改

@狮子的魂 你好,想跟你请教个问题: 我修改了你的源代码,在core.ADictionary这个类的359行,代码: if ( config.LOAD_CJK_PINYIN && ! "null".equa…

混吃等死 2021-11-25 17:11:22 790 0

关于jcseg的拼音问题

@狮子的魂 你好,想跟你请教个问题: 刚刚在solr上搭建了jcseg分词,看开发文档上说:配置拼音=1后可以自动将拼音放入索引中?我配置了以后无效果,…

泛滥成性 2021-11-25 14:23:52 752 0

如何加入像”ASP.NET”的词语到词典里?

您好, 如何加入像”ASP.NET”的词语到词典里? 现在的词库类别好像没有这样的词语分类. 我尝试过加到EN_PUN_WORDS的词典里但没效. 我用的是最新版的jc…

如日中天 2021-11-25 12:01:24 793 0

jcseg分词结果怎么是乱码?

@狮子的魂 你好,想跟你请教个问题:为什么我分词的结果是乱码啊,我明明设置了工程的编码为UTF-8了? …

反目相谮 2021-11-25 07:21:26 938 0
更多

推荐作者

十二

文章 0 评论 0

飞烟轻若梦

文章 0 评论 0

OPleyuhuo

文章 0 评论 0

wxb0109

文章 0 评论 0

旧城空念

文章 0 评论 0

-小熊_

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文