版权声明:本文为博主原创文章,转载请注明出处 https://blog.csdn.net/jingshuiliushen_zj/article/details/82857420
一、numpy:
1、np.zero
np.zeros(5) 1行5列 结果:array([ 0., 0., 0., 0., 0.])
np.zeros((2, 1)) 2行1列 结果:array([[ 0.], [ 0.]])
2、矩阵乘法
np.dot
np.multiply
二、pandas
1、 读取csv文件
参数:
names,自定义列名
keep_default_na=False,没有数据的条目就会被识别为’null’,而不是Nan(用Nan后面的数据处理中如果进行了比较操作会报错,就需要设置一下这个属性)
pdData = pd.read_csv(path, header=None, names=['Exam 1', 'Exam 2', 'Admitted'])
2、判断是否为空
如果列为Nan的形式:
ss=data[data['Date_received'].notnull()]#返回不为空的
ss=data[data['Date_received'].isnull()]#返回为空的
如果列为'null'的形式(读取csv时加入了keep_default_na=False属性)
ss=data[data['Date_received']!='null']#返回不为空的
ss=data[data['Date_received']=='null']#返回为空的
3、插入一列
pdData.insert(0, ‘Ones’, 1) #在第0列插入1,列名为’Ones’