python3 识别教务管理系统验证码方法?

发布于 2021-12-09 00:54:42 字数 880 浏览 1003 评论 7

最近想爬取校内的学生教务系统,用python3.6 + requests库,手动输入验证码便成功用post登录进去,手动输入验证码也挺麻烦的。对图像处理,验证码识别这个方面了解不多,请问以下的这种图片用pytesseract库、Pillow 库+Tesseract-OCR 引擎容易自动识别吗?难的话只能手动输入了。    

看了一些博客说主要步骤有:将彩色图像转化为灰度图、降噪,图片二值化,最后识别文本等。

 

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(7

情场扛把子 2021-12-10 03:32:44

二值化,然后去噪点,切割成单个字符。然后旋转矫正,然后机器学习就可以识别出来了。样本数量足够大,就会更精确

彼岸花ソ最美的依靠 2021-12-10 03:30:35

上学时用php写过一个,思路就是去噪点,图片二值化,切分内容,最后把切好的字母和“字典”进行比对,取相似度最高的。 但是上面的实现比较笨,现在机器学习很火,可以用机器学习框架来做。推荐个入门的框架:http://scikit-learn.org

瑾夏年华 2021-12-10 03:15:37

我是教务处长,今天下课来我办公室一趟。

绝情姑娘 2021-12-10 02:56:01

opencv应该没问题,只要大量样本把库训练好了就行了

辞别 2021-12-10 02:36:30

你说的那些都是库里干的活

深巷少女 2021-12-09 19:22:38

用你说的那些库,很容易的额

多情癖 2021-12-09 18:14:52

之前搞过java版本的 用的ocr 解析这种问题不大

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文