シリーズ
リストプロパティのシリーズ
シリーズパンダは、スライス等のデータ列リストプロパティを複数有する、オブジェクトの類似の一次元アレイを構築しています。タグはまた、1列のインデックスと関連付けられています。
1 |
入力:OBJ =シリーズ([ 11、22、33、44 ]) |
インデックスインデックス、右の値の値を左。インデックスが指定されていない場合は、デフォルトのインデックスはゼロからカウントアップされます。これは、配列のインデックス値によって得られ、そのようなobj.indexなどの症状を、属性することができます。
1 |
入力: |
シリーズを個別に選択することができるか、または配列のインデックス値を渡すことができる方法によってインデックス付け系列値の群に、ブール配列はまた、直列に等しい長さを通過することができます。
numpyのアレイの動作はサポートし、指標と値との間のリンクを保持します。
プロパティ辞書のシリーズ
1 |
入力:'22' で OBJ |
シリーズはまた、固定長命じ辞書として見ることができるだけでなく、インデックスの対応シリーズすなわち、シリーズの辞書、辞書のインデックスを作成するために使用することができます。
1 |
|
在对两个Series进行操作时,只要某个index对应的值缺失一次,即结果为NaN。pandas中的isnull和notnull函数可以检测确实数据。
Series具有name和index.那么属性,在赋值后可以显示出来。
DataFrame
DataFrame是一个表格型的数据结构,含有一组有序的列,每列可以是不同的类型,我的理解是每一列是一个Series,DataFrame的index为所有的列共享并一一对应。
DataFrame既有行索引也有列索引,可以视为由Series组成的字典。
1 |
|
city | year | pop | |
---|---|---|---|
0 | xm | 2000 | 15 |
1 | xm | 2001 | 16 |
2 | fz | 2000 | 20 |
1 |
# 手动为df的列指定顺序,如果原df的列不包括某个index值,则这一列都视为缺失,如下debt |
year | city | pop | debt | |
---|---|---|---|---|
1 | 2000 | xm | 15 | NaN |
2 | 2001 | xm | 16 | NaN |
3 | 2000 | fz | 20 | NaN |
1 |
# DataFrame的一列对应一个series |
1 |
1つのXM |
1 |
#列割り当ては、単一の値が配列のdfと同じ長さに渡すことができる渡すことができ |
シティ | 年 | ポップ | 新しい | |
---|---|---|---|---|
0 | XM | 2000 | 15 | 100 |
1 | XM | 2001 | 16 | 100 |
2 | FZ | 2000 | 20 | 100 |
PS:
Pythonはガベージコレクション機構を備えているので、デルはその参照ではなく、メモリアドレスを削除します。
ガーデンのブログ記事へのリンクwww.cnblogs.com/shinyruouo/articles/pandas1
オリジナル:大カラム --Pandas Pythonのデータ解析を使用して(1)