不可不知的Python自动化脚本
1、引言
小屌丝:鱼哥, 能不能分享几个自动化脚本,让我解放双手, 提升效率
小鱼:我不是写过自动化脚本专篇吗,
小屌丝:额,我咋没印象了呢?
小鱼:… 我去找下
小屌丝:鱼哥,你咋还睡着了。
小鱼:昂. 没睡,就是眼睛累,闭一会。
小屌丝:好,你说没睡就没睡。找到了吗?
小鱼:找…找啥啊?
小屌丝:额… 自动化脚本啊
小鱼:昂… 找,找到了,这篇《Python3,掌握这4个自动化脚本,让工作效率提升200%。》
小屌丝:这篇啊, 我都会了,我的意思,最近有没有打算在分享一点自动化脚本小知识。
小鱼:最近…最近… 是可以哈。
小屌丝:那整啊。
小鱼:整… 再整一瓶。
小屌丝:我去~ 你这没醒酒呢?
小鱼:笑话, 我就没醉过, 不信,你看,我给你说几个python自动化小技巧
小屌丝:鱼哥, 别说, 你写出来, 不然我记不住。
小鱼:写出来,写, 笔墨纸砚走着。
2、自动化脚本实例
2.1 自动PDF 到CSV转换器
实际工作中, pdf文档转换成csv文档,太常见了。
如果需要转换,处理花费银两买VIP进行转换之外, 我们还可以借助tabula库,进行转换。
2.1.1 tabula 介绍
- Tabula是一个Python库,用于处理表格数据。
- 它支持读取和写入CSV、Excel、HTML和JSON格式的数据,并提供了一系列工具来处理表格数据,如数据清洗、合并和转换等。
- Tabula-py库还提供了一些有用的数据可视化功能。
2.1.2 实例
代码示例
# -*- coding:utf-8 -*-
# @Time : 2023-07-07
# @Author : Carl_DJ
'''
实现功能:
pdf文件 → csv文件自动转换
'''
import tabula
filename = input("输入文件的地址: ")
df = tabula.read_pdf(filename, encoding='utf-8', spreadsheet=True, pages='1')
#转换csv文件
df.to_csv('output.csv')
2.2 自动视频下载神器
2.2.1 pytube介绍
关于自动视频下载神器, 我也写过几篇,如下:
但是,今天我们使用另一个库,来实现自动视频下载神器,即:pytube。
- Pytube是一个用于从YouTube等视频网站上下载视频的Python库。
- 它支持多线程下载和断点续传功能,可以自动识别视频的格式并进行相应的转换,同时还可以对下载的视频进行截图等操作。
- Pytube库使用起来非常简单,可以很方便地将视频下载到本地。
2.2.2 实例
# -*- coding:utf-8 -*-
# @Time : 2023-07-07
# @Author : Carl_DJ
'''
实现功能:
使用pytube 实现自动视频下载器
'''
import pytube
#输入Utube的video url
link_url = input('输入Youtube 的url')
#下载
video_download = pytube.Youtube(link_url )
video_download.streams.first().download()
print('下载视频', link_url )
2.3 自动抄袭检查器
2.3.1 difflib 介绍
关于difflib,可能大家并不陌生, 这里,针对difflib小鱼也简单说几句,如下:
- Python的difflib库提供了一组方便的函数和类,用于处理序列数据类型,如列表、字符串等。
- 它提供了一些有用的功能,如逐行比较两个文本文件、计算两个列表之间的差异、合并两个列表等。
- 此外,它还提供了一些有用的可视化功能,如绘制序列数据的折线图和直方图等。
2.3.2 实例
# -*- coding:utf-8 -*-
# @Time : 2023-07-07
# @Author : Carl_DJ
'''
实现功能:
使用difflib进行对比,从而检查出是否存在一样的内容。
'''
from difflib import SequenceMatcher
#检测f1,f2的内容
def plagiarism_checker(f1,f2):
with open(f1,errors="ignore") as file1,open(f2,errors="ignore") as file2:
f1_data=file1.read()
f2_data=file2.read()
res=SequenceMatcher(None, f1_data, f2_data).ratio()
print(f"这两篇文章相似度 {
res*100} % ")
f1=input("请输入需要检测的文件地址: ")
f2=input("请输入源文件地址: ")
plagiarism_checker(f1, f2)
3、总结
看到这里, 今天的分享差不多就到这里了。
其实,在平时的工作生活中, 不管是 PDF→CSV文件格式的转换,还是视频下载,亦或者是两篇文字内容对比, 都很常用。
所以,掌握这几种小技巧,让我们的幸福感提升200%。
我是小鱼:
- CSDN 博客专家;
- 阿里云 专家博主;
- 51CTO博客专家;
- 51认证讲师等;
- 认证金牌面试官;
- 职场面试及培训规划师;
- 多个国内主流技术社区的认证专家博主;
- 多款主流产品(阿里云等)测评一、二等奖获得者;
关注我,带你学习更多更专业更前言的Python技术。