numpy和pandas的常用操作

版权声明:本文为博主原创文章,转载请注明出处 https://blog.csdn.net/jingshuiliushen_zj/article/details/82857420

一、numpy:

1、np.zero
np.zeros(5)   1行5列      结果:array([ 0.,  0.,  0.,  0.,  0.])
np.zeros((2, 1))  2行1列   结果:array([[ 0.], [ 0.]])
2、矩阵乘法
np.dot
np.multiply

二、pandas

1、 读取csv文件
参数:
names,自定义列名
keep_default_na=False,没有数据的条目就会被识别为’null’,而不是Nan(用Nan后面的数据处理中如果进行了比较操作会报错,就需要设置一下这个属性)

pdData = pd.read_csv(path, header=None, names=['Exam 1', 'Exam 2', 'Admitted'])

2、判断是否为空

如果列为Nan的形式:
ss=data[data['Date_received'].notnull()]#返回不为空的
ss=data[data['Date_received'].isnull()]#返回为空的
如果列为'null'的形式(读取csv时加入了keep_default_na=False属性)
ss=data[data['Date_received']!='null']#返回不为空的
ss=data[data['Date_received']=='null']#返回为空的

3、插入一列
pdData.insert(0, ‘Ones’, 1) #在第0列插入1,列名为’Ones’

猜你喜欢

转载自blog.csdn.net/jingshuiliushen_zj/article/details/82857420
今日推荐