对于手写数字最准确的开源 OCR?

发布于 2024-08-27 07:47:44 字数 1539 浏览 4 评论 0原文

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

暗喜 2024-09-03 07:47:44

来自 Tesseract 的常见问题解答

如何只识别数字?

在 2.03 及更高版本中:

使用

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");

在调用 Init 函数之前或将其放入名为 tessdata/configs/digits 的文本文件中:

<前><代码>tessedit_char_whitelist 0123456789

然后你的命令行变成:

tesseract image.tif 输出库 nobatch 数字

警告:在新旧配置变量合并之前,您还必须拥有nobatch参数。

但我认为,由于它是为印刷文本(而不是手写文本)设计的,因此即使仅针对数字,准确性也可能会受到影响。

From the FAQ of Tesseract:

How do I recognize only digits?

In 2.03 and above:

Use

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");

before calling an Init function or put this in a text file called tessdata/configs/digits:

tessedit_char_whitelist 0123456789

and then your command line becomes:

tesseract image.tif outputbase nobatch digits

Warning: Until the old and new config variables get merged, you must have the nobatch parameter too.

But I think since it was designed for printed—not handwritten—text, accuracy might suffer even for digits only.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文