pycharm中tesserocr和pytesseract库的安装与使用
较为详细的几乎零基础的tesserocr和pytesseract库的安装与使用教程(主要介绍安装部分)
前言
这两个库的安装与使用折磨了小白博主几个小时,也是综合了各方资料肝出了这篇较为详细的几乎零基础的tesserocr和pytesseract库的安装与使用教程(主要介绍安装部分),可以帮大家少走一些弯路,利用tesserocr或者pytesseract库,前提是已经安装好Tesseract-OCR软件(文后有安装链接),tesserocr库的安装,问题不大,但要配合tesseract-OCR使用,麻烦死了,反正我搞了好久,还是有一些莫名的错误,听我一句劝就用pytesseract吧!
Tesseract-OCR安装
安装过程如下:
1.下载安装包(直接点开文末链接,下载最新版本就行了)
我安装的是这个:
带dev的为开发版本,不带dev的为稳定版本
2.打开下载的.exe文件,进行安装,建议按默认选项一路同意下去,然后就安装成功,
安装过程中,红色框框部分,可以设置下载各个语言的语言包,也可以点‘+’进行选择性下载,默认语言包为英语的语言包,个人感觉这样下载过慢,可以之后进入官网直接下载对应语言包,下载完成后放到Tesseract-OCR\tessdata\目录下
注:chi_sim.traineddata为简体中文语言包,可在cmd中运行tesseract --list-langs命令,查看已安装的语言包
3、设置环境变量
进入环境变量设置面板(不知道如何进入可以自行百度),出现如下界面:
依次操作,如下图:
- 1.编辑文本
- 2.加入Tesseract-OCR软件安装路径(默认为C:\Program Files\Tesseract-OCR,注意各个环境变量以’;'间隔)
- 3.加入之后,会出现3的情况,环境变量设置ok了
4、查看是否成功
打开cmd,输入tesseract回车,出现如下界面表示成功:
pytesseract库配置
1.安装pytesseract库
和普通包一样,直接pip
2.配置pycharm路径
进入下图界面,打开该文件:
编辑文件,改成下图所示:
注意:C:\Program Files\Tesseract-OCRC:\Program Files\Tesseract-OCR\tesseract.exe,这是文件所在路径,但直接把文件部分改为该路径,运行仍会报错,而应该改成C:/Program Files/Tesseract-OCRC:/Program Files/Tesseract-OCR/tesseract.exe,二者区别仅仅是’\‘与’/'
3.程序测试
import pytesseract
from PIL import Image
img = Image.open('code.jpg')
img = img.convert('RGB')
img.show()
print(pytesseract.image_to_string(img))
# 输出结果:4XWL
code.jpg
4.大功告成(^-^)
tesserocr库配置
简介
再windows中安装tesserocr是比较麻烦的,如果没有Anaconda,不能直接pip,推荐pytesseract
库,下面只简单介绍一下思路
安装
方法一:
下载匹配的whl文件。链接地址:
https://github.com/simonflueckiger/tesserocr-windows_build/releases ,里面只有对应tesseract4.0.0及以下版本,可在cmd中运行tesseract -v查看自己tesseract的版本。下载对应文件时注意自己是win32还是win64,以及自己python版本
以我为例python37,win64
下载之后
pip install D:\tesserocr-2.4.0-cp37-cp37m-win_amd64.whl
自己下载文件的路径
方法二:
有Anaconda,直接
conda install -c simonflueckiger tesserocr
可以下个miniconda和pycharm配合使用,个人觉得还行
链接分享
Tesseract-OCR 下载地址: http://digi.bib.uni-mannheim.de/tesseract
Tesseract-OCR语言包:https://github.com/tesseract-ocr/tessdata
tesserocr PyPI:https://pypi.python.org/pypi/tesserocr
pytesserocr PyPI:https://pypi.org/project/pytesseract/
以上就是全部内容了,有错误与不足望指出O(∩_∩)O!
更多推荐
所有评论(0)