pythpython-dataframe数据预处理（一）之txt数据集文件分割 - 代码天地

pythpython-dataframe数据预处理（一）之txt数据集文件分割

其他 2018-05-29 15:35:06 阅读次数: 0

'''
fun: 一个txt文件a有x行，y列。一行代表一个样本，第1-（y-1）代表特征，第y列代表样本的类别（即标签例如有c1/c2/c3三个类别），
此代码依据样本的标签列，将a.txt分割成 c1.txt、 c2.txt、 c3.txt。
'''
# -*- coding: utf-8 -*-
import pandas as pd
import  numpy as np

feature_size = 45
col_index = []
for i in range(feature_size):
    col_index.append('f%d'%i)
col_index.append('class')      #列索引

data = pd.read_csv(r'./Tr11_end.csv',names=col_index)
rows = len(data )              #求出一共多少行
cols =  data.columns.size
# print("源文件共有 %d 行"%rows)
# print("源文件共有 %d 列"%cols)

classes = data['class'].unique()     #数据共有几个类别
for c in classes:
    name = 'data' + c
    data_seg = data[ data['class']==c ]
    data_seg.to_csv(r'./segm'+"//" +name+".csv",index=False)       #index=false控制输出文件中不自动添加列序号

#data.columns = col_index      #重新为列索引赋值
#print (data.columns)        #列索引名称
# print (data.index)       #行索引名称


#print(data[cols-1][:10])

猜你喜欢

转载自blog.csdn.net/tanlangqie/article/details/80471459

pythpython-dataframe数据预处理（一）之txt数据集文件分割

python-dataframe数据预处理（二）之txt数据集文件合并

Python机器学习数据预处理：读取txt数据文件并切分为训练和测试数据集

数据集的预处理

tensorflow————语义分割，读取自己数据集，并进行预处理。tensorflow处理和glob读取文件路径

SKlearn数据集转换之预处理数据

数据集label的预处理

cora 数据集的预处理

kitti数据集预处理

sklearn机器学习包中的对原始数据的预处理及训练集、测试集的分割

数据预处理--数据集处理

数据预处理之归一化

深度学习数据集预处理之打标签

制作PASCAL VOC格式的分割数据集，生成trainval.txt, train.txt, val.txt文件

文本分类(一) | (2) 数据集及预处理

数据集加载及数据预处理

数据存入hive数据表之前对.csv（数据集）文件的预处理以及数据的上传

数据预处理—文件读取

数据预处理之数据归一化

weka之数据预处理

keras之数据预处理

PaddlePaddle之数据预处理

数据预处理之清洗

划分训练、测试数据集，从Dataframe中选取固定id的行数据并存入txt文件

python 图片数据预处理之--生成带标签的txt文档

数据处理| 自己的数据集json文件转txt文件（YOLO所需文件）

Titanic获救预测数据集预处理

图片数据集预处理，python

[MNIST数据集]输入图像的预处理

深度学习对数据集的预处理

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

面试爱奇艺，竟然挂在第5轮……

scala方法和函数的区别

NYIST--2018大一新生第一次周赛题解

java如何通过client客戶端http实现get/ post请求传递json参数到restful 服务接口

RabbitMQ 队列类型

2018-2019-1 20165311 20165329 20165334 实验一开发环境的熟悉

iOS打包工具配置相应的文件路径一键打包到指定位置

【每日一题】替换空格

【转载】FPGA配置方式

旅行青蛙

每日归档

更多

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)