OCR 和汉字符号算法

发布于 2024-08-29 23:56:59 字数 201 浏览 1 评论 0原文

我有一个朋友正在启动一个新项目。他希望能够使用某种 OCR 来检测汉字符号并将其翻译成其他语言。为此,他在寻找可用算法方面遇到了一些困难,因为这些符号比我们习惯的英文字符要复杂一些。

我们建议他开始研究 2D 卷积和傅里叶变换来开始模式识别过程,但他正在寻找一个好的起点。

不幸的是,我对 OCR 的了解非常有限,因此我可以传递的任何建议可能都会最有帮助!

I have a friend that is starting up a new project. He wants to be able to use some sort of OCR in order to detect and translate Kanji symbols into other languages. He has hit a bit of a brick wall in finding available algorithms in order to do so, since these symbols are a bit more complex than the English characters that we're used to.

We suggested he start looking into 2D convolution and Fourier transforms to start the pattern recognition process, but he is looking for a good starting point.

Unfortunately my knowledge of OCR is extremely limited, so any suggestions that I can pass along will probably be most helpful!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

故人如初 2024-09-05 23:56:59

请查看 nhocr

(另外,还有 tesseract,但我不确定它们是否实际上支持 CJK。)

SO 上有很多关于 OCR 信息的问题,例如,尝试 此搜索

Have a look at nhocr.

(Also, there is tesseract, but I'm not sure if they actually support CJK.)

There are quite a few questions with information about OCR on SO, for instance, try this search.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文