パンダなどCSV、SQL、XLS、JSON、HDF5としてAPIのサポート、多くのファイル形式は、。
CSV
- pandas.read_csv(filepath_or_buffer、9月= '')
- filepath_or_buffer:ファイルパス
- usecols:指定した列名がリストを読み込みます
- sep-デフォルトの文字セグメンテーション「」
# 读取文件,并且指定只获取'open', 'close'指标
data = pd.read_csv("./data/stock_day.csv", usecols=['open', 'close'])
- to_csv
- DataFrame.to_csv(path_or_buf =なし、9月= ''、列=なし、ヘッダ=真、インデックス= trueの場合、モード= 'W'、エンコーディング=なし)
- path_or_buf:文字列またはファイルハンドル、デフォルトなし
- 9月:文字、デフォルト「」
- コラム:シーケンス、オプション
- モード:「W」:「」追加され、書き換え
- インデックス:インデックスを書き込むかどうか
- ヘッダ:書かれているかどうか、ブール値または文字列のリスト、デフォルトの真のカラムインデックス値
- DataFrame.to_csv(path_or_buf =なし、9月= ''、列=なし、ヘッダ=真、インデックス= trueの場合、モード= 'W'、エンコーディング=なし)
HDF5
HDF5ファイルを読み込みおよび格納するために必要なデータフレームを保存するために、キー値を指定します
H5の中のファイルからデータを読み込みます
- pandas.read_hdf(path_or_buf、キー=なし、** kwargsから)
- path_or_buffer:ファイルパス
- キー:キーを読むには
- 戻り値:選択されたオブジェクト
- DataFrame.to_hdf(path_or_buf、キー、\ kwargsから)
- キー:指定されたキーを保存
JSON
- read_json-ファイルを読みます
- orient--指定されたデータ・ディクショナリ形式を読み取ります
- {records-レコードライン名欄:値}
- lines-枝かどうか - ラインの記録
- DataFrame.to_json(path_or_buf =なし、オリエント=なし、ライン=偽)
- オブジェクトストアは、JSON形式であるパンダ
- path_or_buf =なし:ファイルアドレス
- オリエント:{「スプリット」、「記録」、「インデックス」、「列」、「値」}の形で記憶されJSON
- 行:1行オブジェクトとして格納されています
- to_json--ストアファイル - 注意:ライン=真
HDF5ファイルストレージを使用するのが好ましいです
- HDF5に保存されているときは、これが最速のパンダもサポートデフォルトで、使用される圧縮方式がbloscでサポートしています
- 使用圧縮は、スペースを節約し、ディスク使用率を向上することができます
- HDF5は、クロスプラットフォームである、あなたは簡単にトップのHadoopに移行することができます