python学习----网页图片文字识别(简单) - 代码天地

python学习----网页图片文字识别(简单)

编程语言 2018-11-14 21:21:26 阅读次数: 0

在接触python后想对图片进行一些处理 python实现的代码很简单但是关键在于一些包的导入

我使用的python 软件是 pycharm 可以在setting中去下载requests这个包

在安装包PIL 和pytesseract这两个包的时候出现了许多状况直接影响了我的学习进度

首先 pycharm 在setting中无法直接安装PIL这个包但是能可以下载pillow这个包可以说pillow是PIL的升级版吧

然后就是下载pytesseract 这个包了我们可以选择使用pip 命令行进行下载 : pip install pytesseract

之后就是阻碍我进度的来了

我们下载了PIL 和pytesseract 这两个包后是无法运行程序的或者说他依然还会报错是因为我们还得下载Tesseract-ocr 这个识别引擎网上都有安装包在这里就不详细描述了下载安装后因为我们进行的是中文文字的识别所以还得有一个中文语言包（或着可以在安装tesseract-ocr时直接选择下载所有的语言包等待时间较长）：chi_sim.traineddata

然后这样子运行还是会报错首先你的配置ocr的环境（最好放在最上面，我的老师告诉我这个还有优先级问题）

然后在path中新建一个

然后进入pytesseract.py文件中进行修改tesseract_cmd

将等号后面的地址换成在你电脑上的位置前面加上r 是为了防止转义

# 导入包

import requests

from PIL import Image

import pytesseract

# 模仿浏览器进行访问

headers = {"User-Agent": " Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)"}

# 获取网址 ( 该网址是我所读学校的官网上图片所以我进行了处理删掉了一点内容)

url = " http:/*******edu.cn/_upload/article/images/13/d0/55f5bd084947b5f0bd5870f507fd/739926cd-a4ec-4ad9-bec0-d044e3db47c4.jpg"

# 获取图片对图片进行处理

res =requests.get(url = url , headers =headers)

f = open ("c.jpg", "wb")

f.write(res.content)

f.close()

# 图片文字识别

text = pytesseract.image_to_string(Image.open("c.jpg"),lang = "chi_sim")

print(text)

最后我终于成功地运行出来了哈哈哈

猜你喜欢

转载自blog.csdn.net/qq_41980281/article/details/84063214

python学习----网页图片文字识别(简单)

python 图片识别文字

Python 识别图片文字

Python 的图片文字识别

python图片文字识别

Python-图片文字识别

python之图片文字识别

Python识别图片中的文字

【python 图片文字识别】pyocr图片文字识别

如何简单的实现图片文字识别

如何简单的识别电脑图片中的文字

简单识别图片转文字的教程

Python爬虫学习笔记一：简单网页图片抓取

python爬虫简单网页图片

怎么使用文字识别软件简单的进行图片局部识别

python3:识别图片文字

python切图并识别图片中的文字

python使用pytesseract识别图片中的文字

Python图片文字识别转换程序

python 识别图片中的文字信息

python--识别图片中的文字

python 使用pytesseract图片文字识别

python实现图片识别文字程序

深度学习图片文字定位识别

（python）实现一个简单的图片文字识别脚本

超简单使用Python识别图片中的中/英文字/包含工具下载链接

python做简单的图像文字识别

如何简单的去操作图片文字识别

识别图片中的文字简单方法有哪些？

java图片识别文字

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)