ファイル読み込みと保存

パンダなどCSV、SQL、XLS、JSON、HDF5としてAPIのサポート、多くのファイル形式は、。

CSV

  • pandas.read_csv(filepath_or_buffer、9月= '')
    • filepath_or_buffer:ファイルパス
    • usecols:指定した列名がリストを読み込みます
    • sep-デフォルトの文字セグメンテーション「」
# 读取文件,并且指定只获取'open', 'close'指标
data = pd.read_csv("./data/stock_day.csv", usecols=['open', 'close'])
  • to_csv
    • DataFrame.to_csv(path_or_buf =なし、9月= ''、列=なし、ヘッダ=真、インデックス= trueの場合、モード= 'W'、エンコーディング=なし)
      • path_or_buf:文字列またはファイルハンドル、デフォルトなし
      • 9月:文字、デフォルト「」
      • コラム:シーケンス、オプション
      • モード:「W」:「」追加され、書き換え
      • インデックス:インデックスを書き込むかどうか
      • ヘッダ:書かれているかどうか、ブール値または文字列のリスト、デフォルトの真のカラムインデックス値

HDF5

HDF5ファイルを読み込みおよび格納するために必要なデータフレームを保存するために、キー値を指定します

H5の中のファイルからデータを読み込みます

  • pandas.read_hdf(path_or_buf、キー=なし、** kwargsから)
    • path_or_buffer:ファイルパス
    • キー:キーを読むには
    • 戻り値:選択されたオブジェクト
  • DataFrame.to_hdf(path_or_buf、キー、\ kwargsから
    • キー:指定されたキーを保存

JSON

  • read_json-ファイルを読みます
    • orient--指定されたデータ・ディクショナリ形式を読み取ります
    • {records-レコードライン名欄:値}
    • lines-枝かどうか - ラインの記録
  • DataFrame.to_json(path_or_buf =なし、オリエント=なし、ライン=偽)
    • オブジェクトストアは、JSON形式であるパンダ
    • path_or_buf =なし:ファイルアドレス
    • オリエント:{「スプリット」、「記録」、「インデックス」、「列」、「値」}の形で記憶されJSON
    • 行:1行オブジェクトとして格納されています
  • to_json--ストアファイル - 注意:ライン=真

HDF5ファイルストレージを使用するのが好ましいです

  • HDF5に保存されているときは、これが最速のパンダもサポートデフォルトで、使用される圧縮方式がbloscでサポートしています
  • 使用圧縮は、スペースを節約し、ディスク使用率を向上することができます
  • HDF5は、クロスプラットフォームである、あなたは簡単にトップのHadoopに移行することができます

おすすめ

転載: www.cnblogs.com/oklizz/p/11488677.html