一、问题需求
最近要批量处理一批文件,那怎么挨个自动化导入这些文件的路径和名称呢,这肆意而为起的文件名称,手工一个个编辑肯定是不行的。必须得有相应的方法解决这一机械化的操作。
话不多说,上解决方案。
二、解决方案
方法一、使用os库
os库就不多说了,就是使用os.walk()函数1。
os.walk() 方法用于通过在目录树中游走输出在目录中的文件名,向上或者向下。
进一步了解学习可以参考链接Python os.walk() 方法:https://www.runoob.com/python/os-walk.html进行学习。
# 方式一、使用os库
import os
def pdfFilesPath(path):
'''
path: 目录文件夹地址
返回值:列表,pdf文件全路径
'''
filePaths = [] # 存储目录下的所有文件名,含路径
for root,dirs,files in os.walk(path):
for file in files:
filePaths.append(os.path.join(root,file))
return filePaths
# 文件所在文件夹
filepath = r'C:\Users\14369\PythonDataProcessProgram\20200713 昨日市情等PDF文件解析\words_dict'
pdfFilesPath(filepath)
结果示例如下:
方法二、使用glob库
偶然看见一个不错的库:glob库2,真的很不错,相关了解和学习可以参考链接glob模块使用教程:https://www.pynote.net/archives/852进一步了解。
# 方式二 :使用glob库
import re
import glob
# 文件所在文件夹
filepath = r'C:\Users\14369\PythonDataProcessProgram\20200713 昨日市情等PDF文件解析\words_dict'
files = glob.glob(filepath+r'\*.txt')
for file in files:
print(file)