哪些 Python 贝叶斯文本分类模块与 dbacl 类似?
Google 快速搜索显示,有大量贝叶斯分类器以 Python 模块的形式实现。 如果我想要类似于 dbacl 的封装高级功能,那么哪个模块适合我?
培训
% dbacl -l one sample1.txt
% dbacl -l two sample2.txt
分类
% dbacl -c one -c two sample3.txt -v
one
A quick Google search reveals that there are a good number of Bayesian classifiers implemented as Python modules. If I want wrapped, high-level functionality similar to dbacl, which of those modules is right for me?
Training
% dbacl -l one sample1.txt
% dbacl -l two sample2.txt
Classification
% dbacl -c one -c two sample3.txt -v
one
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
我想您会发现 nltk 有帮助。 具体来说,就是分类模块。
I think you'll find the nltk helpful. Specifically, the classify module.
如果您尝试检测语言
这个即使文本很短也能正常工作。
api 与你的非常接近,但是
我不知道它是否称为贝叶斯分类器。
If you're trying to detect language
this works fine even with pretty short texts.
The api is pretty close to yours but
I don't know if it is called a Bayesian classifier.
尝试 Mallet 和 LingPipe。 他们为分类器提供了更多模型。
Try Mallet and LingPipe. they provide more models for the classifier.