OCR 符号与非符号检测/识别

发布于 2024-10-16 06:00:24 字数 179 浏览 5 评论 0原文

在 OCR 应用程序中,您通常会找到图像的连接组件,并在这些组件上运行 OCR 引擎来识别它们。

我的问题是,如果您的连接组件具有训练集中不存在的符号/形状,应该怎么做。

例如,如果我们正在运行数字识别并且图像有一条直线或一个字符,请说“X”或任何其他不是数字的内容。

你怎么知道它不是一个数字?

in an OCR application you'd usually find connected components of the image and run you OCR engine on those components to recognise them.

My question is what should one do if your connected components has symbols/shapes that donot exist in your training set.

For example, if we're running digit recognition and the image has a straight-line or a char, say "X" or anything else which is not a digit.

How can you tell that it's not a digit?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

鲜血染红嫁衣 2024-10-23 06:00:24

通常 OCR 引擎会提供每个识别符号的置信度分数。如果您在此置信度分数上设置接受阈值,您可以区分数字和非数字信息。
祝你好运

Normally OCR engines provides the confidence score for each symbol recognized. If you set an acceptance threshold on this confidence score you can distinguish between digits and non-digit information.
Good luck

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文