一个简单的pd.merge匹配异常值脚本

工作时候老是要处理异常值,就弄了个简单的匹配脚本,看看数据库出来的错误日志有没有问题,这里这个只适合我自己用哈。

import pandas as pd 
import csv 
import numpy as np
road = 'C:/Users/Administrator/Desktop/aaa.csv'
f = open(road)#专门打开文字文件的csv
fr = csv.reader(f)
for i in fr: #读入pandas
    data = pd.DataFrame(i,columns=['a'])
f.close()关闭文件
data=pd.DataFrame(data['a'].str.split(';')[0],columns=['a'])#将文字列文件拆分
data_p = pd.read_csv('E:/anaconda/bin/2021-03-11.csv')

data= pd.DataFrame({
    
    'b':np.arange(len(data.values)),'a':data.a})
data_p= pd.DataFrame({
    
    'bp':np.arange(len(data_p.values)),'ap':data_p.a})

c=pd.merge(data_p,data,how='outer',left_on='bp',right_on='b')
c.to_csv('C:/Users/Administrator/Desktop/lll.csv',index=None)

猜你喜欢

转载自blog.csdn.net/lisenby/article/details/114662923
今日推荐