Pythonの学習23:パンダの一つ(シリーズ)

パンダが迅速かつ容易にデータ解析作る、と操作ツールのデータ構造含むモジュールnumpyのに基づいて構築され、最も一般的なデータ構造は、次のとおり関係に似てnumpyのの1次元配列に似たシーケンスデータブロックとデータフレームシリーズ、シリーズ、テーブルとデータフレーム2次元テーブルと同様。

>>> インポートPDとしてパンダ
 >>> からパンダのインポートシリーズ、データフレーム

、パンダのデータ型

データ要素の型を表示するには、DTYPEプロパティを使用すると、パンダは主に以下のDTYPE:

  • 対象:文字列型を示し、
  • INT:タイプの整数
  • フロート:浮動小数点表現タイプ
  • 日時:時間タイプを示します
  • BOOL:ブール表現
  • カテゴリ:カテゴリー

図1に示すように、ビュー・データ・タイプ

ビューのデータ]ボックスには、データの列を入力します。

DF [ ' COL_NAME ' ] .dtypes

図2に示すように、データ型の変換

astype(DTYPE)関数列の特定のタイプにデータフレームを変換するため、パンダDTYPEは、サポートされているタイプであってもよいがnumpy.dtypeであってもよく、Pythonのタイプであってもよいです。

列が文字列にデータフレームを変更するには、STR、Pythonのタイプは、「オブジェクトは、」パンダの文字列型がサポートされています。

DF [ ' COL_NAME ' ] .astype(STR)
[DF ' COL_NAME ' ] .astype(' オブジェクト'

変換関数の3、他のタイプ

to_numericとして提供される機能を使用して、パンダ()、to_datetime()

第二に、シーケンス

一連の要素は、インデックスシリーズオブジェクトによってアクセスすることができ、データの順序集合と関連する指標組成物です。

1、シーケンスを作成

データの唯一のセットシリーズ最も簡単に生成することができる使用して、この時点でインデックスを順次0整数からインクリメントされます。

OBJ =シリーズ([4,7、-5,3])

インデックスの順序と値は、インデックスの属性値とオブジェクトシリーズで見ることができます。

obj.values
 #1 #アレイ([4,7、-5,3])
obj.index
 #Int64Index([0,1,2,3])

カスタムシーケンスを作成するには、リストを使用することができます。

OBJ =シリーズ([4,7、-5,3]、インデックス= [ ' D '' B '' '' C ' ])

データはPythonの辞書構造に保存されている場合も、シリーズの辞書で直接作成することができます。

>>> SDATA = { ' B ':12 ' ':13、' D ':14、' C ':10 }
 >>> SD = pd.Series(SDATA)
B     12 13 
D     14 
C     10 
DTYPE :int64モード

2、シーケンスの要素へのアクセス

インデックスによって配列の要素にアクセスするために、値の配列要素を変更することができます

SD [ ' A ' ] = 4

 

 

 

 

参照文献:

 

おすすめ

転載: www.cnblogs.com/ljhdo/p/11514685.html