python遍历获取指定文件夹下所有文件


一、问题需求

      最近要批量处理一批文件,那怎么挨个自动化导入这些文件的路径和名称呢,这肆意而为起的文件名称,手工一个个编辑肯定是不行的。必须得有相应的方法解决这一机械化的操作。
话不多说,上解决方案。

二、解决方案

方法一、使用os库

os库就不多说了,就是使用os.walk()函数1

os.walk() 方法用于通过在目录树中游走输出在目录中的文件名,向上或者向下。

进一步了解学习可以参考链接Python os.walk() 方法:https://www.runoob.com/python/os-walk.html进行学习。

# 方式一、使用os库
import os

def pdfFilesPath(path):
    '''
    path: 目录文件夹地址
    
    返回值:列表,pdf文件全路径
    '''
    filePaths = [] # 存储目录下的所有文件名,含路径
    for root,dirs,files in os.walk(path):
        for file in files:
            filePaths.append(os.path.join(root,file))
    return filePaths

# 文件所在文件夹
filepath = r'C:\Users\14369\PythonDataProcessProgram\20200713 昨日市情等PDF文件解析\words_dict'
pdfFilesPath(filepath)

结果示例如下:
在这里插入图片描述

方法二、使用glob库

偶然看见一个不错的库:glob库2,真的很不错,相关了解和学习可以参考链接glob模块使用教程:https://www.pynote.net/archives/852进一步了解。

# 方式二 :使用glob库
import re
import glob

# 文件所在文件夹
filepath = r'C:\Users\14369\PythonDataProcessProgram\20200713 昨日市情等PDF文件解析\words_dict'
files = glob.glob(filepath+r'\*.txt')
for file in files:
    print(file)

在这里插入图片描述


  1. Python os.walk() 方法:https://www.runoob.com/python/os-walk.html ↩︎

  2. glob模块使用教程:https://www.pynote.net/archives/852 ↩︎

猜你喜欢

转载自blog.csdn.net/weixin_42521211/article/details/115246582