结巴分词

结巴分词

文章 4 浏览 377

Nodejs 实现可训练的中文分词实践

前段时间在研究 TF-IDF、杰卡德相似系数计算文本的相似度的时候(目前我的博客中部分文章底部的“猜你喜欢”推荐的文章就是用这种算法计算出来的),…

绝影如岚 2021-11-17 12:45:30 1230 0 0

TextGrocery 短文本分类工具中文文档 v0.1.3

TextGrocery是一个基于 LibLinear 和 结巴分词 的短文本分类工具,特点是高效易用,同时支持中文和英文语料。 GitHub 项目链接 性能 训练集:来自32个…

JSmiles 2021-01-09 14:41:50 1410 0 0

CppJieba 是结巴(Jieba)中文分词的 C++ 版本

特性 源代码都写进头文件 include/cppjieba/*.hpp 里,include 即可使用。 支持 utf8 编码。 项目自带较为完善的单元测试,核心功能中文分词(utf8)的…

JSmiles 2021-01-05 23:43:21 2807 0 0

NodeJieba 结巴分词的 Node.js 版本

NodeJieba 是结巴中文分词的 Node.js 版本实现, 由 CppJieba 提供底层分词算法实现, 是兼具高性能和易用性两者的 Node.js 中文分词组件。 特点 词典…

JSmiles 2020-12-31 23:41:39 2045 0 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文