手机端使用ocr算法从图像中提取文本

发布于 2024-10-09 01:14:52 字数 40 浏览 1 评论 0原文

用于通过移动设备从图像中提取文本的最佳 ocr 算法是什么 相机?

what is the best ocr algorithm used to extract text from image by mobile
camera?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

总以为 2024-10-16 01:14:52

这取决于您的应用要求。

通常 OCR 引擎只能返回字符、字体、单词、行或区域信息。您需要添加许多其他模块并调整它们以获得最佳结果。

首先,图像预处理是相机OCR应用所必需的。背景、噪声去除、二值化、调整大小......应尽可能添加到干净的图像中。

其次,您需要找到文本区域。该算法不仅取决于图像特征,还取决于您的 OCR 目标。例如,如果您需要OCR车牌号,您可以使用车牌号的长度、宽度或高度来更准确地定位。

OCR之后,您可以添加一些后处理来纠正一些OCR错误。常见的 OCR 引擎如 Abyy、ExperVision、Omnipage、GOCR、Tesseract 都是根据常见文档、杂志或办公用纸进行训练的。如果您的文档比较特殊,您可以在 OCR 层上建立高级数据提取或分析逻辑。

That depends on your application requirements.

Usually OCR engine can only return characters, font, word, line or region information. You need add many other modules and tune them to get the best results.

First, image preprocessing is necessary for camera OCR application. Background, noise removal, binarization, resize ... should be added to clean image as possible as you can.

Secondly, you need locate the text region. The algorithm not only depends on image features but also on your OCR objective. For example, if you need to OCR plate number, you can use the plate number's length, width or height for more accurate location.

After OCR, you can add some post processing to correct some OCR errors. Common OCR engines such as Abyy, ExperVision, Omnipage, GOCR, Tesseract are all trained according to common documents, magazine or office paper. If your documents are special, you can establish your high-level data extraction or analysis logic over OCR layer.Permalink

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文