使用pip安装paddleocr的踩坑过程


操作系统:windows
python版本:python3.6
paddleocr:2.0.1
paddlepaddle:2.0.0


之前使用的是paddleocr的github上直接拉取代码,进行配置,比较臃肿;现在直接使用pip的方式进行安装,但是过程的坑比较多,多次尝试,终于找到了一个合适的方式

安装过程如下:

首先安装paddleocr

pip install paddleocr==2.0.1
复制代码

出现的错误如下

image.png

后面说了Microsoft Visual C++ 14.0 乱七八糟的,其实就是python-Levenshtein没安上,不要被吓唬到

image.png

我们使用www.lfd.uci.edu/~gohlke/pyt… 网站种的whl文件进行安装

image.png

下载下来放到虚拟环境中的Scripts文件夹中,

image.png

在虚拟环境中执行

pip install python_Levenshtein-0.12.0-cp36-cp36m-win_amd64.whl
复制代码

安装完成python_Levenshtein之后,我们在次运行pip install paddleocr==2.0.1

我们会发现可以完成安装了

image.png

在安装高版本的时候,paddleocr==2.0.3的时候,还会出现和上面python_Levenshtein的一样的错误原因的fasttext,但是像python_Levenshtein的解决方法解决并行不通,聪明的我选择了放弃高版本。

首先安装paddlepaddle

我在安装完成了paddleocr之后,直接运行了测试代码,提示如下问题

ModuleNotFoundError: No module named 'paddle'
复制代码

显然我们要安装paddlepaddle,在这里选择的是2.0.0 的cpu版本,这个地方的版本都可以感觉

pip install paddlepaddle==2.0.0 -i https://mirror.baidu.com/pypi/simple
# 或
pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
复制代码

这个安装过程一般不会出现什么幺蛾子

测试代码

验证上面的安装过程是否可以

from paddleocr import PaddleOCR, draw_ocr


ocr = PaddleOCR()  # need to run only once to download and load model into memory
img_path = '1.png'
result = ocr.ocr(img_path)
for line in result:
    print(line)
复制代码

image.png

我们可以得到识别出来的文字和坐标信息还有置信度

在这还出现了一个幺蛾子

from paddleocr import PaddleOCR, draw_ocr
ocr = PaddleOCR()  # need to run only once to download and load model into memory
img_path = '1.png'
result = ocr.ocr(img_path,cls=True)
for line in result:
  print(line)
复制代码

就是我们cls的参数设置成True,就会爆出来一个错误,错误如下 image.png 从源码角度分析: image.png 03.png image.png 在回调的时候会出现text_classifier image.png 所以会出现上面的错误

  • 第一种解决方式:在不影响使用的情况下,将cls=True去掉即可,并不会影响效果。
  • 第二种解决方式:ocr = PaddleOCR(use_angle_cls=True, use_gpu=False, lang='ch'),在初始化的时候,带上use_angle_cls=True参数即可。

Guess you like

Origin juejin.im/post/7032131449528516615