如何使用贝叶斯方法识别1个文本中的内容是姓名?
假设有这样1个文本:
张三
李四
田七
赵圆圆
赵又廷
...
现在打算使用贝叶斯方法来对上述文本进行识别,识别其内容为姓名,那么如何实现呢?可以提供思路、文章链接或相应的代码。
如果使用的是skcit-learn如何进行训练?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
要识别什么?你的意思是通过判断汉字识别是否为姓名?
要是这样的话就是分类问题,要有训练样本,把所有姓氏都定为特征项,但是太多了啊,暂时没想到别的
首先你得先把姓和名分开,乃义务贝叶斯可以简单的理解为在A发生的情况下B发生的概率。
分开之后我想你也应该会做了吧~