python 提取目录中特定类型的文件 - 代码天地

python 提取目录中特定类型的文件

其他 2019-10-20 14:01:15 阅读次数: 0

python使用‘os’和‘re’模块提取目录中特定类型的文件，这两个模都是安装python自带的，所以不需要安装。

思路：

使用os库lilstdir获取文件夹中的所有文件名，然后带上文件夹路径组合成为完整绝对路径，然后去判断该路径文件的类型，如果是文件，使用re库正则相关函数去筛选出特定后缀的文件；如果是文件夹，递归处理此文件夹。

注意：

下面代码提取的是‘xlsx’文件，如果需要提取其他类型的文件，替换re.complie('str')中的正则表达式即可。

源码：

import os
import re

fileList = []

# Function can get *.xls/*.xlsx file from the directory
"""
dirpath: str, the path of the directory
"""
def _getfiles(dirPath):
    # open directory 
    files = os.listdir(dirPath)
    # re match *.xls/xlsx，you can change 'xlsx' to 'doc' or other file types.
    ptn = re.compile('.*\.xlsx')
    for f in files:
        # isdir, call self
        if (os.path.isdir(dirPath + '\\' + f)):
            getfiles(dirPath + '\\' + f)
        # isfile, judge
        elif (os.path.isfile(dirPath + '\\' + f)):
            res = ptn.match(f)
            if (res != None):
                fileList.append(dirPath + '\\' + res.group())
        else:
            fileList.append(dirPath + '\\无效文件')


# Function called outside
"""
dirpath: str, the path of the directory
"""
def getfiles(dirPath):
    _getfiles(dirPath)
    return fileList

if __name__ == "__main__":
     path = 'D:\\pyfiles\\test'
     res = getfiles(path)
     print('提取结果：')
     for f in res:
         print(f)

猜你喜欢

转载自www.cnblogs.com/yocichen/p/11693240.html

python 提取目录中特定类型的文件

python学习------指定目录下搜索特定类型的文件

python-通过正则表达式，提取txt文件中的特定内容，保存到新文件中

用 Python 定位特定类型文件

[python].csv文件的数据处理：将目录文件下的所有.csv文件提取出特定的列，去重并储存为新.csv文件

python查找目录及子目录下特定文件

python提取Excel中的特定列生成新的表格

python提取tuple列表中的特定位置的值

python 返回指定目录下的所有文件与特定文件

Python删除txt文件中特定字符

使用Python查找目录下特定后缀名的文件

利用python copy目录下所有特定后缀的文件

Python中的文件及目录操作

python提取文件中某个区域的内容

python 实现读取当前目录下含有特定字符的目录和文件

Python3.遍历某路径提取特定文件名

java 提取(解压)rar文件中特定后缀的文件并保存到指定目录

PYTHON提取LOG或TXT特定字段

利用python对Excel中的特定数据提取并写入新表

Python基础练习-004-提取字符串中的特定字符

python提取具有某种特定字符串中的数据

Python实现csv文件中特定字符串的删除

Python2_实现文件中特定内容的获取

使用Python删除PDF文件名中的特定文字

详解python中的文件与目录操作

python中目录和文件管理

Python中对文件和目录的操作

python文件目录调整，待摸索中

python中目录文件相关操作

python中跨目录(文件)import函数

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)