使用神经网络进行 OCR：数据提取

发布于 2024-08-25 16:45:50 字数 604 浏览 5 评论 0 原文

我正在使用 AForge 库框架及其神经网络。

当我训练我的网络时，我创建了大量大尺寸（30 pt）的图像（每个字母每个字体一个图像），剪下实际的字母，将其缩小到较小的尺寸（10x10 px），然后保存它到我的硬盘。然后我可以去读取所有这些图像，用数据创建我的 double[] 数组。目前我是在像素的基础上做这件事的。

因此，一旦我成功训练了我的网络，我就会测试网络并让它在具有不同大小（大写和小写）的字母表的示例图像上运行。

但结果并不乐观。我训练了网络，使 RunEpoch 的误差约为 1.5（因此几乎没有误差），但仍然有一些字母在我的测试图像中无法正确识别。

现在我的问题是：这是否是因为我的学习方法错误造成的（基于像素的与本文中建议使用的受体：http://www.codeproject.com/KB/cs/neural_network_ocr.aspx - 我可以使用其他方法来提取网络数据吗？）还是会发生这种情况因为我从图像中提取字母来查看的分割算法很糟糕？

有人对如何改进它有想法吗？

原文