Python读取excel中的图片

  excel中有图片是很常见的,但是通过python读取excel中的图片没有很好的解决办法。

  网上找了一种很聪明的方法,原理是这样的:

  1、将待读取的excel文件后缀名改成zip,变成压缩文件。

  2、再解压这个文件。

  3、在解压后的文件夹中,就有excel中的图片。

  4、这样读excel中的图片,就变成了读文件夹中的图片了,和普通文件一样,可以做各种处理。

  解压后的压缩包如下:
  

python脚本如下:

 1 '''
 2 File Name:   readexcelimg
 3 Author:      tim
 4 Date:        2018/7/26 19:52
 5 Description: 读取excel中的图片,打印图片路径
 6     先将excel转换成zip包,解压zip包,包下面有文件夹存放了图片,读取这个图片
 7 '''
 8 
 9 import os
10 import zipfile
11 
12 
13 # 判断是否是文件和判断文件是否存在
14 def isfile_exist(file_path):
15     if not os.path.isfile(file_path):
16         print("It's not a file or no such file exist ! %s" % file_path)
17         return False
18     else:
19         return True
20 
21 
22 # 修改指定目录下的文件类型名,将excel后缀名修改为.zip
23 def change_file_name(file_path, new_type='.zip'):
24     if not isfile_exist(file_path):
25         return ''
26 
27     extend = os.path.splitext(file_path)[1]  # 获取文件拓展名
28     if extend != '.xlsx' and extend != '.xls':
29         print("It's not a excel file! %s" % file_path)
30         return False
31 
32     file_name = os.path.basename(file_path)  # 获取文件名
33     new_name = str(file_name.split('.')[0]) + new_type  # 新的文件名,命名为:xxx.zip
34 
35     dir_path = os.path.dirname(file_path)  # 获取文件所在目录
36     new_path = os.path.join(dir_path, new_name)  # 新的文件路径
37     if os.path.exists(new_path):
38         os.remove(new_path)
39 
40     os.rename(file_path, new_path)  # 保存新文件,旧文件会替换掉
41 
42     return new_path  # 返回新的文件路径,压缩包
43 
44 
45 # 解压文件
46 def unzip_file(zipfile_path):
47     if not isfile_exist(zipfile_path):
48         return False
49 
50     if os.path.splitext(zipfile_path)[1] != '.zip':
51         print("It's not a zip file! %s" % zipfile_path)
52         return False
53 
54     file_zip = zipfile.ZipFile(zipfile_path, 'r')
55     file_name = os.path.basename(zipfile_path)  # 获取文件名
56     zipdir = os.path.join(os.path.dirname(zipfile_path), str(file_name.split('.')[0]))  # 获取文件所在目录
57     for files in file_zip.namelist():
58         file_zip.extract(files, os.path.join(zipfile_path, zipdir))  # 解压到指定文件目录
59 
60     file_zip.close()
61     return True
62 
63 
64 # 读取解压后的文件夹,打印图片路径
65 def read_img(zipfile_path):
66     if not isfile_exist(zipfile_path):
67         return False
68 
69     dir_path = os.path.dirname(zipfile_path)  # 获取文件所在目录
70     file_name = os.path.basename(zipfile_path)  # 获取文件名
71     pic_dir = 'xl' + os.sep + 'media'  # excel变成压缩包后,再解压,图片在media目录
72     pic_path = os.path.join(dir_path, str(file_name.split('.')[0]), pic_dir)
73 
74     file_list = os.listdir(pic_path)
75     for file in file_list:
76         filepath = os.path.join(pic_path, file)
77         print(filepath)
78 
79 
80 # 组合各个函数
81 def compenent(excel_file_path):
82     zip_file_path = change_file_name(excel_file_path)
83     if zip_file_path != '':
84         if unzip_file(zip_file_path):
85             read_img(zip_file_path)
86 
87 
88 # main
89 if __name__ == '__main__':
90     compenent('/Users/Desktop/test/people.xlsx')

猜你喜欢

转载自www.cnblogs.com/yangtze-yufei/p/9374454.html