1、引言

小屌丝：鱼哥，能不能分享几个自动化脚本，让我解放双手，提升效率
小鱼：我不是写过自动化脚本专篇吗，
小屌丝：额，我咋没印象了呢？
小鱼：… 我去找下

在这里插入图片描述
小屌丝：鱼哥，你咋还睡着了。
小鱼：昂. 没睡，就是眼睛累，闭一会。
小屌丝：好，你说没睡就没睡。找到了吗？
小鱼：找…找啥啊？
小屌丝：额… 自动化脚本啊
小鱼：昂… 找，找到了，这篇《Python3，掌握这4个自动化脚本，让工作效率提升200%。》
小屌丝：这篇啊，我都会了，我的意思，最近有没有打算在分享一点自动化脚本小知识。
小鱼：最近…最近… 是可以哈。
小屌丝：那整啊。
小鱼：整… 再整一瓶。
小屌丝：我去~ 你这没醒酒呢？
小鱼：笑话，我就没醉过，不信，你看，我给你说几个python自动化小技巧
小屌丝：鱼哥，别说，你写出来，不然我记不住。
小鱼：写出来，写，笔墨纸砚走着。

2、自动化脚本实例

2.1 自动PDF 到CSV转换器

实际工作中， pdf文档转换成csv文档，太常见了。
如果需要转换，处理花费银两买VIP进行转换之外，我们还可以借助tabula库，进行转换。

2.1.1 tabula 介绍

Tabula是一个Python库，用于处理表格数据。
它支持读取和写入CSV、Excel、HTML和JSON格式的数据，并提供了一系列工具来处理表格数据，如数据清洗、合并和转换等。
Tabula-py库还提供了一些有用的数据可视化功能。

2.1.2 实例

代码示例

# -*- coding:utf-8 -*-
# @Time   : 2023-07-07
# @Author : Carl_DJ
'''
实现功能：
	pdf文件 → csv文件自动转换
'''

import tabula

filename = input("输入文件的地址: ")
df = tabula.read_pdf(filename, encoding='utf-8', spreadsheet=True, pages='1')
#转换csv文件
df.to_csv('output.csv')

2.2 自动视频下载神器

2.2.1 pytube介绍

关于自动视频下载神器，我也写过几篇，如下：

但是，今天我们使用另一个库，来实现自动视频下载神器，即：pytube。

Pytube是一个用于从YouTube等视频网站上下载视频的Python库。
它支持多线程下载和断点续传功能，可以自动识别视频的格式并进行相应的转换，同时还可以对下载的视频进行截图等操作。
Pytube库使用起来非常简单，可以很方便地将视频下载到本地。

在这里插入图片描述

2.2.2 实例

# -*- coding:utf-8 -*-
# @Time   : 2023-07-07
# @Author : Carl_DJ
'''
实现功能：
	使用pytube 实现自动视频下载器
'''

import pytube

#输入Utube的video url
link_url = input('输入Youtube 的url')
#下载
video_download = pytube.Youtube(link_url )
video_download.streams.first().download()
print('下载视频', link_url )

2.3 自动抄袭检查器

2.3.1 difflib 介绍

关于difflib，可能大家并不陌生，这里，针对difflib小鱼也简单说几句，如下：

Python的difflib库提供了一组方便的函数和类，用于处理序列数据类型，如列表、字符串等。
它提供了一些有用的功能，如逐行比较两个文本文件、计算两个列表之间的差异、合并两个列表等。
此外，它还提供了一些有用的可视化功能，如绘制序列数据的折线图和直方图等。

2.3.2 实例

# -*- coding:utf-8 -*-
# @Time   : 2023-07-07
# @Author : Carl_DJ
'''
实现功能：
	使用difflib进行对比，从而检查出是否存在一样的内容。
'''

from difflib import SequenceMatcher
#检测f1,f2的内容
def plagiarism_checker(f1,f2):
    with open(f1,errors="ignore") as file1,open(f2,errors="ignore") as file2:
        f1_data=file1.read()
        f2_data=file2.read()
        res=SequenceMatcher(None, f1_data, f2_data).ratio()
        
print(f"这两篇文章相似度 {
      
      res*100} % ")

f1=input("请输入需要检测的文件地址: ")
f2=input("请输入源文件地址: ")
plagiarism_checker(f1, f2)

在这里插入图片描述

3、总结

看到这里，今天的分享差不多就到这里了。
其实，在平时的工作生活中，不管是 PDF→CSV文件格式的转换，还是视频下载，亦或者是两篇文字内容对比，都很常用。

所以，掌握这几种小技巧，让我们的幸福感提升200%。

我是小鱼：

CSDN 博客专家；
阿里云专家博主；
51CTO博客专家；
51认证讲师等；
认证金牌面试官；
职场面试及培训规划师；
多个国内主流技术社区的认证专家博主；
多款主流产品(阿里云等)测评一、二等奖获得者；

关注我，带你学习更多更专业更前言的Python技术。

Python3，自从掌握了这3个自动化脚本生成神器，让我的幸福感提升了200%。

不可不知的Python自动化脚本