5行python代码帮你搞定百度文库复制问题

第一步:我们先来配置环境,下载pycharm,python3.8;这个我就不赘述了。安装完成后进入第二步

第二步:创建python项目,记住自己项目包路径,如:D:\pythondemo01\venv\Lib\site-packages

第三步:使用cmd命令:1)pip install pillow --target=D:\pythondemo01\venv\Lib\site-packages

                                       2)pip install pytesseract --target=D:\pythondemo01\venv\Lib\site-packages

               或者在pychram的设置里面添加:如图:

                                                  

第四步:安装识别引擎tesseract-ocr

              下载链接: https://pan.baidu.com/s/1J0HNoVhX8WexS_5r0k2jDw 密码: ywc3

第五步:因为tesseract-ocr默认不支持中文识别,将下载到的文件:chi_sim.traineddata 放到Tesseract-OCR安装目录下,如                     图:

第六步:修改pytesseract.py的路径为刚刚软件安装的位置路径:

第七步:环境到此就配置完成了,现在可以撸代码了;代码如下:

效果图如下

完结!

发布了22 篇原创文章 · 获赞 11 · 访问量 7850

猜你喜欢

转载自blog.csdn.net/DK18397606232/article/details/103026264