像这类验证码,一共也只有26个大写字母,可以尝试自己写识别算法(完全符合要求的第三方库比较难找):
灰度化、二值化、去噪
将一张完整的图片切成5份,每一份1个字母;
使用【学习算法(简单的如kNN)+ 识别库】识别图片,获取字母;
如果识别不出来,刷新验证码回到1或随机猜一个字母;
5个字母都识别后,去验证;
验证通过后,将5张图片以及对应识别出来的字母加入识别库;
验证失败,刷新验证码,回到1
识别库中每一个字母有多张对应的图片,这个工作早期需要自己做,有一定成功率就用学习算法自己去下载验证码图片、自己去验证、增长识别库,从而提高识别率。
先截取下来,然后使用tesseract进行识别。一般tesseract如果识别不了,可以试试一些google的一些机器学习的库,或者使用第3方平台进行识别。
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
暂无简介
文章 0 评论 0
接受
发布评论
评论(2)
像这类验证码,一共也只有26个大写字母,可以尝试自己写识别算法(完全符合要求的第三方库比较难找):
灰度化、二值化、去噪
将一张完整的图片切成5份,每一份1个字母;
使用【学习算法(简单的如kNN)+ 识别库】识别图片,获取字母;
如果识别不出来,刷新验证码回到1或随机猜一个字母;
5个字母都识别后,去验证;
验证通过后,将5张图片以及对应识别出来的字母加入识别库;
验证失败,刷新验证码,回到1
识别库中每一个字母有多张对应的图片,这个工作早期需要自己做,有一定成功率就用学习算法自己去下载验证码图片、自己去验证、增长识别库,从而提高识别率。
先截取下来,然后使用tesseract进行识别。一般tesseract如果识别不了,可以试试一些google的一些机器学习的库,或者使用第3方平台进行识别。