当前位置：文江博客话题详情

C# ocr image-processing

如何检测图像中的单词

发布于 2024-08-10 13:56:09 字数 361 浏览 3 评论 0原文

我需要找出用户点击的图像中的单词。到目前为止，我已经成功对图像进行 OCR 处理。我的 C# 应用程序中有一个图片框控件。用户可以在任何文本周围绘制一个框并将其拖动到文本框以填充文本框。我已经完成了这个。但现在我有一个新的要求，说用户可以选择一个文本框，然后单击图像中的单词，以便将该单词填充到文本框中。

我不知道如何继续。如何从图像中单独剪切单词部分并将其提供给 OCR？用户可以单击单词的任何部分。

请给我任何指示。我应该遵循什么算法来找到用户点击的单词的边界。如果我找到了边界，我可以使用 copyfromscreen 方法将其从图像中剪切出来，并将其交给 ocr 引擎来获取文本。

希望我在这里说清楚了我的问题。

谢谢和问候，迪内什。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

撩心不撩汉 2024-08-17 13:56:09

如果您的 OCR 正常工作，我最初的方法是尝试以初始点击点为中心进行某种搜索。

IE。在用户点击的地方制作一个小框，OCR，如果有噪音，制作一个更大的框，OCR，重复，直到 OCR 结果命中。

回复收藏 0 原文

深府石板幽径 2024-08-17 13:56:09

如果您已获得 OCR 数据，根据 OCR 库，您也许能够执行反向查找并确定指定像素坐标处的字符。我使用过的 OCR 库为每个字符提供矩形坐标，然后可以将其分组为单词（组合矩形）。那么问题就是确定点击发生在哪个矩形内。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

苦中寻乐

文章 0 评论 0

lueluelue

文章 0 评论 0

嗼ふ静

文章 0 评论 0

王权女流氓

文章 0 评论 0

与花如笺

文章 0 评论 0

残酷

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文