实战演习（十三）——遍历文件夹中的所有内容 - 代码天地

实战演习（十三）——遍历文件夹中的所有内容

其他 2020-02-16 17:19:31 阅读次数: 0

笔者希望在平日的工作学习中，挖掘数据的价值，找寻数据的秘密，笔者认为，数据的价值不仅仅只体现在企业中，个人也可以体会到数据的魅力，用技术力量探索行为密码，让大数据助跑每一个人，欢迎直筒们关注我的公众号，大家一起讨论数据中的那些有趣的事情。

我的公众号为：livandata

在数据收集过程中，会有各种各样的格式，同时这些文件也存储在不同的文件夹中，为了方便起见，此处整理出一个可以遍历各个文件夹的代码，以方便后期读取数据使用，如果要读取对应文件夹中的内容，只需要将文件夹中的格式写入并记录路径就可以了：

#!/usr/bin/env python
# _*_ UTF-8 _*_
# 个人公众号：livandata
import os
def eachfile(path, arr):
    pathdir = os.listdir(path=path)
    pathdir = [i for i in pathdir if i !='.DS_Store']
    for dir in pathdir:
        child = path+'/'+dir
        if os.path.isfile(child):
            arr.append(child)
        else:
            eachfile(child, arr)
    return arr

def readfile(filename):
    arr = []
    # 解析各个类型文件
    for file in filename:
        suffix = file.split('.')[-1]
        if(suffix=='xls' or suffix == 'xlsx'):
            # 读取excel的文件
            arr.append()
        if(suffix=='txt'):
            # 读取txt的文件
            arr.append()
    arr.append(filename)
    return arr

def file_rename(path):
    for file in os.listdir(path):
        fi = file.split('.')[0]
        os.rename(os.path.join(path, file), os.path.join(path, fi+'.xml'))

if __name__ == "__main__":
    file_path = '/Users/*******/PycharmProjects/data/Page Data'
    # arr是一个全局变量，用来存储文件及路径，所以下面两行需要一起出现：
    arr = []
    data = eachfile(file_path, arr)
    # 组合成文件数组：data
    readfile(data)

代码定义了两个函数首先读取文件名称，然后再逐一的读取文件中的数据。

livan1234

发布了137 篇原创文章 · 获赞 93 · 访问量 16万+

私信关注

猜你喜欢

转载自blog.csdn.net/livan1234/article/details/93318226

实战演习（十三）——遍历文件夹中的所有内容

python遍历文件夹中的所有jpg文件

python遍历文件夹中的所有文件

遍历文件夹中的所有图片

遍历文件夹所有文件

python遍历文件夹及其子文件夹中的所有文件

Unity C# 删除文件夹以及文件夹中的所有内容

层次遍历文件夹将文件夹下所有图片复制到指定文件夹中

linux中给某文件夹及文件夹下的所有内容赋最大权限

遍历文件夹所有文件，并获得其路径写入txt文件中

python遍历文件夹中的所有图像（按名称顺序读取）并存入本地文件夹

python下遍历文件夹中所有文件

c#遍历文件夹获得所有文件

php遍历文件夹中所有的文件

php遍历文件夹所有文件

c++遍历文件夹内所有文件

Node.js遍历文件夹的所有文件

java遍历文件夹及所有子文件

python 遍历文件夹中所有文件

python 遍历文件夹的所有文件

VC下遍历文件夹中的所有文件的几种方法

C#遍历指定文件夹中的所有指定文件

shell递归遍历目录中的所有文件、文件夹

遍历文件夹中所有文本

java遍历文件夹找到所有get方法

PHP遍历文件夹及子文件夹所有文件

Java中遍历文件夹、获取文件内容

sftp取文件夹内所有内容

删除文件夹，包括其下面所有内容

Java IO之复制文件夹中的所有内容

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)