windows10使用tesseract-OCR打不开训练数据

发布于 2022-09-04 09:10:38 字数 1228 浏览 26 评论 0

代码:

    # -*- coding: utf-8 -*-
    
    try:
        import Image
    except ImportError:
        from PIL import Image
    
    import pytesseract
    
    
    print(pytesseract.image_to_string(Image.open('d:/testimages/name.gif'), lang='chi_sim'))
    print(pytesseract.image_to_string(Image.open('d:/testimages/mobile.gif')))

错误信息:

    Traceback (most recent call last):
      File "D:/test.py", line 11, in <module>
        print(pytesseract.image_to_string(Image.open('d:/testimages/name.gif'), lang='chi_sim'))
      File "C:\Users\dell\AppData\Local\Programs\Python\Python35\lib\site-packages\pytesseract\pytesseract.py", line 165, in image_to_string
        raise TesseractError(status, errors)
    pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\Tesseract-OCR\\tessdata/chi_sim.traineddata')

训练数据在C:Program Files (x86)Tesseract-OCRtessdata已经存在,截图:
enter image description here

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

故人如初 2022-09-11 09:10:38
wget https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata
mv chi_sim.traineddata C:\Program Files (x86)\Tesseract-OCR\tessdata
不知在何时 2022-09-11 09:10:38

pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \Program Files (x86)\Tesseract-OCR\tessdata/chi_sim.traineddata')
解决方案:
设置环境变量 TESSDATA_PREFIX
C:Program Files (x86)Tesseract-OCRtessdata (供参考,以实际安装路径为准)

也可以直接拷贝代码D:/test.py到C盘运行,不推荐。

另外如果不设置环境变量,在安装盘之外的路径运行tesseract时会提示:
Please make sure the TESSDATA_PREFIX environment variable is set to the parent d irectory of your "tessdata" directory
设置了环境变量后,问题解决

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文