中文分词

中文分词

文章 31 浏览 1.1k

从若干多个 无序 的汉字中选择出其中的 成语 ,有什么高效地方法吗?

用python玩微信的成语猜猜看,要从24个汉字中选择出其中的成语。 先说一下我的方案:将24个汉字的所有4字组合,暴力穷举,分词(jieba),结果中存在…

谁许谁一生繁华 2022-09-06 13:07:41 50 0

elasticsearch特定领域的搜索,分词更新频繁,如何对已经索引的文档重新分词

elasticsearch特定领域的搜索,分词更新频繁,如何对已经索引的文档重新分词?…

灼疼热情 2022-09-04 17:29:58 31 0

在网页中一段文字里按住Ctrl和方向键可以按词组来移动光标?求它是如何实现的?

在网页中一段文字里按住Ctrl和方向键可以按词组来移动光标?求它是如何实现的? 好像各种编辑器都有这种功能? 谢谢 UPD::在markdown编辑器中输入连…

霓裳挽歌倾城醉 2022-09-01 05:07:46 30 0

php逐个汉字遍历字符串

我有个字符串,格式为$str = "中华人民abc共和\x01国",如何逐个汉字遍历该字符串呢?即:能够输出“中” “华” “人” “民” “a” ... 我现在使…

想你的星星会说话 2022-08-29 17:25:26 24 0

solr如何配置同时支持中文和英文的分词器?

我使用solr配置了三个字段,其中一个字段的类型为textgeneral,此类型可以对中文进行分词,但是不对英文分词,那么如何配置一个类型,使其既支持中文…

假装爱人 2022-08-27 12:00:35 39 0

discuz! 2.5x 3.0x的自动tag系统是如何实现的?

最近有个项目要实现自动产生标签,发现discuz! 3.0x已经实现了这个功能,想问问discuz是如何实现分词和产生标签的。 例如:http://www.playsc.com/for…

扛刀软妹 2022-08-25 11:41:51 25 0

PHP 英文分词 有什么好介绍的吗?

http://www.ftphp.com/scws/这种是中文的, 对英文分词,仅仅将其打散成单词。不知道是否有分词的开源 产品。多谢。…

小苏打饼 2022-08-24 09:28:00 25 0

如何设计一种只需要针对文章的标题进行分词搜索,而不需要对文章内容全文搜索?

例如:文章标题是: 中国劣货盛行的原因 假设用户输入:“中国房价上涨的原因” 采用某种分词技术 分词后为:中国 房价 上涨 的 原因 如何在后台进行搜…

月下客 2022-08-24 01:04:31 35 0

SCWS的scws_get_words函数是否存在bug

SCWS是国人做的一个很优秀的分词库,它的php扩展可以方便地处理中文分词。现在发现其中一个函数scws_get_words函数的问题,这个函数是用来获取分词结…

遥远的绿洲 2022-08-23 23:46:01 45 0

分词器选择的问题

http://www.oschina.net/home/search?q=%E5%88%86%E8%AF%8D%E5%99%A8&scope=project 里的分词器哪个最好?问下红薯,oschina用的哪个分词器?…

柒夜笙歌凉 2021-11-13 19:02:58 907 0

现在流行的一些中文分词器不能单独使用么?

看了ik和paoding,貌似都只能和lucene结合使用。如果用不到lucene,单独使用分词功能如何做?…

情绪失控 2021-11-10 16:14:53 682 0

做 搜索 那个分词怎么整了。

类似oschina的搜索那样。。…

柠檬 2021-11-09 05:31:58 816 0

lucene 中文分词

lucene 中文分词 哪个分词器哪个版本好?开源的和不开源的最好一样说一个。最好带有实例,谢谢!…

狼亦尘 2021-11-04 23:33:15 792 0
更多

推荐作者

醉城メ夜风

文章 0 评论 0

远昼

文章 0 评论 0

平生欢

文章 0 评论 0

微凉

文章 0 评论 0

Honwey

文章 0 评论 0

qq_ikhFfg

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文