当前位置：文江博客话题详情

已知字体的 OCR

发布于 2024-09-17 19:17:31 字数 71 浏览 9 评论 0原文

我正在寻找一个 OCR 库，可以用字体参数化，因为我一直都知道，而且我相信这样识别结果会好很多。

有谁知道吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

冰火雁神 2024-09-24 19:17:31

大多数 OCR 引擎都能很好地处理这种情况。事实上，如果页面上只有一种字体可以识别，OCR 引擎不会感到困惑。根据我的经验，这很奇怪但很真实。

如果 OCR 引擎首先可以读取您的字体，那么我会直接使用它而不用担心它。有更好的选择来提高识别度。

许多 OCR 引擎允许您设置一些识别参数来帮助提高识别效果，例如固定宽度或比例、衬线或非衬线、机器或手写打印。您还可以仅选择字符子集（例如大写或数字）以显着改善结果。也就是说，如果您只有数字字符，那么 0（零）字符永远不会与“O”或“o”或“Ø”混淆。您会发现这些提示比能够选择 OCR 确切字体类型的选项更有效。

其他引擎将允许您训练 OCR 引擎来处理新字体，如果您有奇怪的字体，这将有很大帮助。

如果你的图像质量很好，字体干净且大小合适，那么我建议使用 Google 的 Tesseract OCR 和 OCROpus，如 Michael 所建议的米奥。它是免费的，并且在干净、清晰的文本上运行良好。如果文本有点困难，那么肯定有更好的 OCR 引擎，例如 ABBYY、Prime Recognition、Omnipage 等，尽管它们需要花钱。

回复收藏 0 原文