利用Python将csv文件按照某列分成小csv - 代码天地

利用Python将csv文件按照某列分成小csv

其他 2019-04-03 22:29:50 阅读次数: 0

需求：网上下载的csv文件，包含的几十万的数据，想要根据MMSI的值分为不同的csv文件
主要步骤：

read_csv：读取存放所有数据的csv文件
drop_duplicates：去掉重复的数据（默认为所有特征值匹配才相同）
groupby：按照MMSI特征值进行分组
对分组后的数据逐行进行写入

遇到的主要问题：

分组后的每一组数据，如何写入不同的csv文件中。解决使用的是to_csv
写入文件后，发现每隔一行写一行数据，将模式改为“ab+”即mode=“ab+”
若是多次写入一个文件，会重复，因此每次写入前，若是文件中存在数据，进行清空

下面是代码：

# 将存放轨迹数据的excel文件按照，船的编号拆分为多个
def break_excel_MMSI():
    x_head_key = ['MMSI', 'BaseDateTime', 'LAT', 'LON', 'SOG', 'COG', 'Heading', 'VesselName', 'IMO', 'CallSign',
                  'VesselType', 'Status', 'Length', 'Width', 'Draft', 'Cargo']

    csv_file = 'F:\\myPythonProject\\boatJsonData\\AIS_2016_12_Zone06\\AIS_ASCII_by_UTM_Month\\2016\\AIS_2016_12_Zone06.csv'

    df = pd.read_csv(csv_file, header=0)
    df.columns = x_head_key

    # 去掉重复数据
    ind_frame = df.drop_duplicates(keep='first')

    # 对数据进行分组处理
    grouped = df.groupby(x_head_key[0])  # according different categories to group by the df

    file = 'F:\\myPythonProject\\boatJsonData\\AIS_2016_12_Zone06\\AIS_ASCII_by_UTM_Month\\2016\\track_by_mmic\\'

    for value, group in grouped:
        filename = file + str(value) + '.csv'
        try:
            f = open(filename, 'w')
            if f:
                # 清空文件内容
                f.truncate()

            # 将新数据写入文件
            group.to_csv(filename, header=x_head_key, index=False, mode='ab+')
        except UnicodeEncodeError:
            print("编码错误, 该数据无法写到文件中, 直接忽略该数据")

猜你喜欢

转载自blog.csdn.net/baidu_38271024/article/details/88207428

利用Python将csv文件按照某列分成小csv

python按照列行写入csv文件

python按照列写入csv文件

Python 读取csv的某列

python按照自定义列写入csv文件

Python将大的csv文件拆分多个小的csv文件

Python读取CSV文件特定某两列的内容

Python-利用xlrd、numpy、pandas读取excel文件某行某列的数据（.csv文件）（.xls文件）

利用python将txt文件转换为csv

python将csv表格的某列用唯一的数字id表示

利用python操作csv文件

Python基础——csv文件中某列数据替换为数字

[python].csv文件的数据处理：将目录文件下的所有.csv文件提取出特定的列，去重并储存为新.csv文件

Python中利用numpy将数组（矩阵）存成csv文件，将csv文件读取为数组（矩阵）

使用Csvhelper读取CSV文件某行某列数据

JAVA怎么读取.csv文件以及只读取.csv文件的某行某列的值

使用python获取csv文本的某行或某列数据

python获取csv文本的某行或某列数据

【Python】统计csv某列中单词的词频

利用python把excel文件转成csv文件

55 Python - 利用python生成CSV文件

Python与CSV文件（CSV模块） Python与CSV文件（CSV模块）

Python 将csv文件里的某一列时间戳转化为想要的时间格式

利用python对csv文件进行分割

python利用numpy模块读取csv文件

利用Python写入CSV文件的方法

说说如何利用 Python 处理 CSV 文件

用python将csv文件导入mysql

用 Python 将数据写到 CSV 文件

Python将json写入csv文件

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)