パイソン--Pandasを使用してデータ分析(1)

シリーズ

リストプロパティのシリーズ

シリーズパンダは、スライス等のデータ列リストプロパティを複数有する、オブジェクトの類似の一次元アレイを構築しています。タグはまた、1列のインデックスと関連付けられています。

1 
2
3
4
5
6
7
8
9
入力:OBJ =シリーズ([ 11223344 ])
入力:
OBJ =シリーズ([ 11223344 ]、インデックス= [ 1234 ])
OBJ
出力:1 11 2 22 3 33 4 44




インデックスインデックス、右の値の値を左。インデックスが指定されていない場合は、デフォルトのインデックスはゼロからカウントアップされます。これは、配列のインデックス値によって得られ、そのようなobj.indexなどの症状を、属性することができます。

1 
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
入力:
OBJ [ 1 ]
出力:11入力: リー= [ 123 ] OBJ [李] 出力:1つの11 2 22 3 33入力: OBJ [ ] 出力:1 11 2 22 4 44入力: OBJ> 23出力:1 2 3 4





















シリーズを個別に選択することができるか、または配列のインデックス値を渡すことができる方法によってインデックス付け系列値の群に、ブール配列はまた、直列に等しい長さを通過することができます。

numpyのアレイの動作はサポートし、指標と値との間のリンクを保持します。

プロパティ辞書のシリーズ

1 
2
3
4
5
6
7
8
9
10
11
12
13
入力:'22'   OBJ 
出力:真の
入力:
ジ= { 110122023303 } シリーズ(DI)出力:1 101 2 202 3 303









シリーズはまた、固定長命じ辞書として見ることができるだけでなく、インデックスの対応シリーズすなわち、シリーズの辞書、辞書のインデックスを作成するために使用することができます。

1 
2
3
4
5
6
7
8
9
10
11
12

input:
obj = Series([4,7,9,3], index=['b','d','c','a'])
obj2 = Series([3,3,3,3], index=['a','c','d','z'])
obj+obj2
output:
a 6.0
b NaN
c 12.0
d 10.0
z NaN
dtype: float64

在对两个Series进行操作时,只要某个index对应的值缺失一次,即结果为NaN。pandas中的isnull和notnull函数可以检测确实数据。

Series具有name和index.那么属性,在赋值后可以显示出来。

DataFrame

DataFrame是一个表格型的数据结构,含有一组有序的列,每列可以是不同的类型,我的理解是每一列是一个Series,DataFrame的index为所有的列共享并一一对应。

DataFrame既有行索引也有列索引,可以视为由Series组成的字典。

1
2
3
4
5
6
7
8
9
10
11
12
13
14

data = {
'city':['xm','xm','fz'],
'year':[2000,2001,2000],
'pop':[15,16,20]
}
# 嵌套字典创建df时,外键作为列,内键作为行,可以转置改变
data2 = {
'city':{0:'xm',1:'xm'},
'year':{0:2000,1:2001},
'pop': {0:15, 1:16}
}
frame = DataFrame(data)
frame
city year pop
0 xm 2000 15
1 xm 2001 16
2 fz 2000 20
1
2
3
# 手动为df的列指定顺序,如果原df的列不包括某个index值,则这一列都视为缺失,如下debt
frame2=DataFrame(data, columns=['year','city','pop','debt'],index=[1,2,3])
frame2
year city pop debt
1 2000 xm 15 NaN
2 2001 xm 16 NaN
3 2000 fz 20 NaN
1
2
3
4
5
# DataFrame的一列对应一个series
# 返回的series拥有原DF相同的索引
# 即拥有相同引用,而不是拷贝
city=frame2['city']
city
1
2
3
4
1つのXM 
2 XM
3 FZの
名前:都市、DTYPE:オブジェクト
1 
2
3
4
#列割り当ては、単一の値が配列のdfと同じ長さに渡すことができる渡すことができ
、フレーム[ 「新しい新規」 ] = 100
フレーム
順割り当ての[200は、300 100]#フレーム[「新しい新規」] =
シティ ポップ 新しい
0 XM 2000 15 100
1 XM 2001 16 100
2 FZ 2000 20 100

PS:

Pythonはガベージコレクション機構を備えているので、デルはその参照ではなく、メモリアドレスを削除します。

ガーデンのブログ記事へのリンクwww.cnblogs.com/shinyruouo/articles/pandas1

オリジナル:大カラム  --Pandas Pythonのデータ解析を使用して(1)


おすすめ

転載: www.cnblogs.com/chinatrump/p/11424083.html