データ解析処理のPythonの種類-04Nan

#NaNは、数ではない--means 
のPdとしてインポートパンダ
NPとしてインポートnumpyの
パンダからシリーズ、データフレームのインポート

#N = np.nan
#プリント(型(n))#<クラス'フロート'>
プリント(1 + n)を#nan


シリーズ#nan
#S1 =シリーズ([1,2、np.nan、3,4]、インデックス= [ 'A'、 'B'、 'C'、 'D'、 'E'])
プリント(S1)
#1.0
#1 B 2.0
#CのNaN
#D 3.0
#1 E 4.0
#DTYPE:のfloat64

#プリント(s1.isnull())

#Bの偽
#C真
#D偽
#E偽
#1 DTYPE。ブール

#print(s1.dropna())#去掉值为ナン的行
#1.0
#B 2.0
#Dの3.0
#E 4.0
#DTYPEは:のfloat64


データフレームに#NaNを
#dframe DATAFRAME =([1,2,3]、[np.nan、5,6]、[7、np.nan、9]、[np.nan、np.nan 、np.nan]])
#print(dframe)
#0 1 2
#0 1.0 2.0 3.0
#1 5.0 6.0
#2 7.0 9.0における
ウィスラー#3、

#print(dframe.isnull())
#0 1 2
# 0偽偽偽
#1真FALSE FALSE
#2 FALSE TRUE偽
#3 TRUE TRUE真

#DF1 = dframe.dropna(軸= 0)
プリント(DF1)
#0 1 2
#0 1.0 2.0 3.0
#DF2 = dframe.dropna (軸= 1)
プリント(DF2)
空のデータフレーム
#カラム:[]
ランキング:[0、1、2、3]

(軸= 0、どのように= '任意の')#DF3 = dframe.dropna# デフォルトいかなるへ
#印刷(DF3)
#2。1 0
#0 1.0 2.0 3.0

#DF4 = dframe.dropna(軸= 0、=どのように「すべて全てのNaNまで削除「)#
プリント(DF4)
#2 1 0
#0 1.0 2.0 3.0
#5.0 6.0のNaN 3。1つの
#2のNaN 3 7.0 9.0


#dframe2 DATAFRAME =([[1,2,3、np.nan ]、[2、np.nan、5,6]、[,. 7 np.nan、np.nan ,. 9]、[1、np.nan、np.nan、np.nan]])
プリント(dframe2)
2. 3. 1 0#
#0 1.0 2.0 3.0のNaN 3
#1のNaN 3 2.0 5.0 6.0
#2のNaN 3 7.0 9.0のNaN 3
#のNaN 3のNaN 3。3のNaN 3 1.0

#DF2 = dframe2.dropna(THRESH =なし)はNaNが削除される含む#1
#プリント( DF2)
空のデータフレーム
#カラム:[0 ,. 1,2 ,. 3]
ランキング:[]

#DF2 = dframe2.dropna(THRESH = 2 )#2 以上の値が削除されるのNaN
#プリント(DF2)
#2. 3. 1 0
#0 1.0 2.0 3.0のNaN 3
#1のNaN 3 2.0 5.0 6.0
#2のNaN 3 7.0 9.0のNaN 3

#print(dframe2.fillna(値= 1) )# 1は全ての値のNaNが充填されている
#0123
#0 1.0 2.0 3.0 1.0
#1 2.0 1.0 5.0 6.0
#2 1.0 7.0 1.0 9.0
#3 1.0 1.0 1.0 1.0

#プリント(dframe2.fillna(値= {0 :0,1:1,2:2,3:3}))# 最初の列、1秒の列0、3列目と2、第4カラム3が充填されている
#0123
#0 1.0 2.0 3.0 3.0
#1 2.0 1.0 5.0 6.0
#2 0.0 7.0 2.0 9.0
#3 1.0 1.0 2.0 3.0



#------------------ ----------------
#マルチレベルのインデックス
#S1 =シリーズ(np.random.randn(6)、インデックス= [ '1'、 '1'、 '1'、 '2'、 '2'、 '2']、[ 'A'、 'B 」、 'C'、 ''、 'B'、 'C']])
プリント(S1)
#1 0.450512
#Bの-0.432511
#Cの-0.280125
#2 0.333269
#B 0.123369
#Cの-2.000533
#1 DTYPE :のfloat64

#プリント(S1 [ '1'])
#0.870953
#B 0.128729
#C 0.958637
#1 DTYPE:のfloat64
#プリント(型(S1 [ "1"]))#<クラス'pandas.core.series.Series' >
#プリント(S1 [ '1'] [ 'A'])#-1.6023742345246375
#プリント(S1の[:、 'A'])
#1 0.891888
#2 -1.087930
#1 DTYPE。float64

#DF1 = s1.unstack()
プリント(DF1)
#abcの
#1 -0.300567 0.124230 -0.488987
#2 1.618275 -0.155234 -0.284849

#DF2 = DATAFRAME([S1 [ '1']、S1 [ '2'])
プリント(DF2)
#1のABC
#0 -0.757713 0.801604 1.975145
#1 -0.112589 0.083369 -1.174583

#S2 = df1.unstack()
プリント(S2)
#1 -0.037449
#2 -1.364984
#Bの1 -1.748248
#2 0.581338
#C 1 1.758856
#2 -0.244383
#1 DTYPE:のfloat64

#S2 = df1.T.unstack()
プリント(S2)
#1 0.343976
1.664177 B#
#Cの-0.039674
#2 0.357644
#0.357658 B
#Cの-0.308326
#1 DTYPE:のfloat64

#DF = DATAFRAME(np.arange(16).reshape(4,4))
プリント(DF)
#0 1 2 3
#0 0 1 2 3
#1 4 5 6 7
#2 8 9 10 11
#3~12 13人の14 15

#1 DF =データフレーム(np.arange(16).reshape(4,4)、インデックス= [ 'A'、 ''、 'B'、 'B']、[1,2,1、 2])
プリント(DF)
#0 1 2 3
#1 0 1 2 3
#2 4 5 6 7
#1 B 1 8 9 10 11
#2 12 13 14 15

DF = DATAFRAME(np.arange#(16 ).reshape(4,4)、インデックス= [ 'A'、 ''、 'B'、 'B']、[1,2,1,2]、列= [ 'BJ'、」 BJ」、 'SH'、 'GZ']、[8,9,8、8])
#プリント(DF)
#BJ SH GZの
#8 9 8 8
#1 0 1 2 3
#2 4 5 6 7
#1 B 1 8 9 10 11
#2 12 13 14 15

#プリント([8] [ 'BJ'] DF)
#0,1
#2~4
#Bを1~8
#2~12
#名:8、DTYPE:INT32

おすすめ

転載: www.cnblogs.com/nikecode/p/11130885.html