为了方便,我一口气将20多个python自动化相关的模块记录了下来。

众所周知,python比较强大的地方就是他的第三方处理模块太多了。

基本上就是想要什么就有什么的一个状态,并且这样的python模块还在不断的增加,看得人眼花缭乱!

今天,我将常用的python做自动化相关的模块大致梳理了一下,希望能够给小伙伴们做自动化带来一些帮助,也便于自己以后方便查找记录。

首先就是常见的办公文档的处理了,比如说Excel、Word、Ppt、Pdf等等,若是能够将这些操作变成自动化,可以先想象一下那有多Happy!

1、python办公自动化模块

Excel自动化

xlwings:xlwings是目前最为全能,且运行效率较高,即综合评分较高的一个模块。

openpyxl:openpyxl比较适合处理一些针对单元格格式的数据,包括公式、图片、批注等等。

xlrd:xlrd是python对于Excel的扩展工具,只能读取数据不能进行数据写入操作。

xlwt:xlwt的性质同xlrd一样,不同的是xlwt只能写入不能进行读取操作。

xlutils:xlutils用来对于Excel的数据处理、过滤等操作,使用时需要搭配xlrd、xlwt一起使用。

扫描二维码关注公众号,回复: 14766441 查看本文章

xlsxwriter:xlsxwriter提供了和Excel一样的数据类型,具有很好的数据兼容性。

pandas:pandas可以说是Excel数据处理中最简单易用的一个python模块,经常和numpy数据分析和可视化图表一起使用。

Marmir:Marmir可以把输入的Python数据结构转换为电子表单,能使用最少的配置完成对表格的处理。

Word自动化

python-docx:python-docx是一个利用python来读写word文件的第三方库,有配套的官方API。

textract:textract可以从各种不同的文档中以text文本的方式进行信息提取。

Fdf自动化

PyPDF2:PyPDF2是专门用于python操作Pdf文档的三方模块,可以轻松完成对Pdf文件的读写、加解密、水印等操作。

ReportLab:ReportLab是python开发的强大的开源引擎,可以创建出复杂的Pdf文档或是矢量图形等。

PDFminer:PDFminer比较适合获取和分析文本数据,可以获取某一页某一行的Pdf精确信息。

Fpt自动化

python-pptx:python-pptx是用于创建和更新 PowerPoint(.pptx)文件的Python库,典型的是从数据库内容生成自定义的可用于演示的工程状态报告。

2、python边缘自动化模块

win32com:win32com主要为Python提供调用Windwos Office底层组件的支持,只能用于对Windows系统的支持。

unoconv:unoconv是一个命令行工具,可以用来批量转换文档或创建Pdf、Word等操作。

Tablib:Tablib是一个格式无关的表格数据集库,支持标记/筛选和无缝格式导入/导出。

SnowNLP:SnowNLP是一个使用比较简单的自然语言处理模块,经常可以结合jieba中文分词模块一起使用达到比较好的效果。

TextBlob:TextBlob是开源的文本处理模块,可以执行很多自然语言的处理任务,不太友好的是只能支持英文语言,还是建议使用jieba比较靠谱。

TextGrocery:TextGrocery 是一个基于SVM算法的短文本分类工具,内置了jieba模块的分词处理,让文本分类变得简单。

NumPy:NumPy(Numerical Python)是Python的一种开源的数值计算扩展,可以用来处理和存储大型矩阵数据,比python内置的list列表等的效率要高很多。

往期精彩

python情感分析:基于jieba的分词及snownlp的情感分析!

假如有一个专属于python的终端工具,那绝对非他莫属!

python自制的文件解压缩小工具,同时支持7z/zip/rar三种格式!

猜你喜欢

转载自blog.csdn.net/chengxuyuan_110/article/details/128924547