pandasを使用して表形式のデータを行ごとにランダムに削除します

import pandas as pd
import random
import os
#1.加载excel数据
os.chdir('')
data=pd.read_excel('')
#2.将data的序号转化为列表list1
list1=list(data.index)
#3.使用random.sample()在列表list1中随机删除10个序号得到序号列表list2
list2=random.sample(list1,10)
#4.将list2加载到drop方法中,得到数据data1
data1=data.drop(list2)
#5.查看data1信息
data1.info()
#6.创建excel——newdata.xlsx
writer=pd.ExcelWriter('newdata.xlsx')
#7.将data1储存到newdata.xlsx
data1.to_excel(writer,'sheet1',startcol=0,index=False)
#8.保存文件
writer.save()

おすすめ

転載: blog.csdn.net/weixin_47970003/article/details/121762800