使用pip安装paddleocr的踩坑过程

操作系统：windows
python版本：python3.6
paddleocr:2.0.1
paddlepaddle:2.0.0

之前使用的是paddleocr的github上直接拉取代码，进行配置，比较臃肿；现在直接使用pip的方式进行安装，但是过程的坑比较多，多次尝试，终于找到了一个合适的方式

安装过程如下：

首先安装paddleocr

pip install paddleocr==2.0.1
复制代码

出现的错误如下

后面说了Microsoft Visual C++ 14.0 乱七八糟的，其实就是python-Levenshtein没安上，不要被吓唬到

我们使用www.lfd.uci.edu/~gohlke/pyt… 网站种的whl文件进行安装

下载下来放到虚拟环境中的Scripts文件夹中，

在虚拟环境中执行

pip install python_Levenshtein-0.12.0-cp36-cp36m-win_amd64.whl
复制代码

安装完成python_Levenshtein之后，我们在次运行pip install paddleocr==2.0.1

我们会发现可以完成安装了

在安装高版本的时候，paddleocr==2.0.3的时候，还会出现和上面python_Levenshtein的一样的错误原因的fasttext，但是像python_Levenshtein的解决方法解决并行不通，聪明的我选择了放弃高版本。

首先安装paddlepaddle

我在安装完成了paddleocr之后，直接运行了测试代码，提示如下问题

ModuleNotFoundError: No module named 'paddle'
复制代码

显然我们要安装paddlepaddle,在这里选择的是2.0.0 的cpu版本，这个地方的版本都可以感觉

pip install paddlepaddle==2.0.0 -i https://mirror.baidu.com/pypi/simple
# 或
pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
复制代码

这个安装过程一般不会出现什么幺蛾子

测试代码

验证上面的安装过程是否可以

from paddleocr import PaddleOCR, draw_ocr


ocr = PaddleOCR()  # need to run only once to download and load model into memory
img_path = '1.png'
result = ocr.ocr(img_path)
for line in result:
    print(line)
复制代码

我们可以得到识别出来的文字和坐标信息还有置信度

在这还出现了一个幺蛾子
from paddleocr import PaddleOCR, draw_ocr
ocr = PaddleOCR()  # need to run only once to download and load model into memory
img_path = '1.png'
result = ocr.ocr(img_path,cls=True)
for line in result:
  print(line)
复制代码
就是我们cls的参数设置成True,就会爆出来一个错误，错误如下从源码角度分析：在回调的时候会出现text_classifier 所以会出现上面的错误

第一种解决方式：在不影响使用的情况下，将cls=True去掉即可，并不会影响效果。
第二种解决方式：ocr = PaddleOCR(use_angle_cls=True, use_gpu=False, lang='ch')，在初始化的时候，带上use_angle_cls=True参数即可。

使用pip安装paddleocr的踩坑过程

安装过程如下：

首先安装paddleocr

首先安装paddlepaddle

测试代码

Guess you like