パンダが迅速かつ容易にデータ解析作る、と操作ツールのデータ構造含むモジュールnumpyのに基づいて構築され、最も一般的なデータ構造は、次のとおり関係に似てnumpyのの1次元配列に似たシーケンスデータブロックとデータフレームシリーズ、シリーズ、テーブルとデータフレーム2次元テーブルと同様。
>>> インポートPDとしてパンダ >>> からパンダのインポートシリーズ、データフレーム
、パンダのデータ型
データ要素の型を表示するには、DTYPEプロパティを使用すると、パンダは主に以下のDTYPE:
- 対象:文字列型を示し、
- INT:タイプの整数
- フロート:浮動小数点表現タイプ
- 日時:時間タイプを示します
- BOOL:ブール表現
- カテゴリ:カテゴリー
図1に示すように、ビュー・データ・タイプ
ビューのデータ]ボックスには、データの列を入力します。
DF [ ' COL_NAME ' ] .dtypes
図2に示すように、データ型の変換
astype(DTYPE)関数列の特定のタイプにデータフレームを変換するため、パンダDTYPEは、サポートされているタイプであってもよいがnumpy.dtypeであってもよく、Pythonのタイプであってもよいです。
列が文字列にデータフレームを変更するには、STR、Pythonのタイプは、「オブジェクトは、」パンダの文字列型がサポートされています。
DF [ ' COL_NAME ' ] .astype(STR) [DF ' COL_NAME ' ] .astype(' オブジェクト')
変換関数の3、他のタイプ
to_numericとして提供される機能を使用して、パンダ()、to_datetime()
第二に、シーケンス
一連の要素は、インデックスシリーズオブジェクトによってアクセスすることができ、データの順序集合と関連する指標組成物です。
1、シーケンスを作成
データの唯一のセットシリーズ最も簡単に生成することができる使用して、この時点でインデックスを順次0整数からインクリメントされます。
OBJ =シリーズ([4,7、-5,3])
インデックスの順序と値は、インデックスの属性値とオブジェクトシリーズで見ることができます。
obj.values #1 #アレイ([4,7、-5,3]) obj.index ##Int64Index([0,1,2,3])
カスタムシーケンスを作成するには、リストを使用することができます。
OBJ =シリーズ([4,7、-5,3]、インデックス= [ ' D '、' B '、' '、' C ' ])
データはPythonの辞書構造に保存されている場合も、シリーズの辞書で直接作成することができます。
>>> SDATA = { ' B ':12 ' ':13、' D ':14、' C ':10 } >>> SD = pd.Series(SDATA) B 12 13 D 14 C 10 DTYPE :int64モード
2、シーケンスの要素へのアクセス
インデックスによって配列の要素にアクセスするために、値の配列要素を変更することができます
SD [ ' A ' ] = 4
参照文献: