パンダのヘルプ

1. read_csv 
read_csv方法定义:

pandas.read_csv(filepath_or_buffer、9月= ''、デリミタ=なし、ヘッダ= 'INFER'、名前=なし、
index_col =なし、usecols =なし、スクイーズ= Falseに、接頭辞=なし、mangle_dupe_cols =真、DTYPE =なし、
エンジン=なし、コンバータ=なし、true_values =なし、false_values =なし、skipinitialspace = Falseの、
のskipRows =なし、NROWS =なし、na_values =なし、keep_default_na =真、na_filter = Trueの場合、冗長=偽、
skip_blank_lines =真、parse_dates = Falseを、infer_datetime_format = Falseを、keep_date_col = Falseを、
date_parser =なし、dayfirst = Falseを、イテレータ= Falseを、チャンク=なし、圧縮= '推論'、
数千人=なし、小数点以下= B ''、 lineterminator =なし、quotechar = '"'、引用= 0、EscapeCharに=なし、 
コメント=なし、エンコーディング=なし、方言=なし、tupleize_cols =なし、error_bad_lines =真、
warn_bad_lines =真、skipfooter = 0、skip_footer = 0、ダブルクォート=真、delim_whitespace =偽、
as_recarray =なし、compact_ints =なし、use_unsigned =なし、真= low_memory、buffer_lines =なし、
memory_map =偽、float_precision =なし
。1 
2 
。3 
4 
5 
6 
7 
8 
9 
10 
11 
12である
共通パラメータ:

filepath_or_buffer:STR、pathlib。STR、pathlib.Path、py._path.local.LocalPathまたは任意のオブジェクト (ファイルハンドルやStringIOをなど)read()メソッドでは、 
HTTP、FTP、S3およびファイル:URL、利用できるURLの種類は、することができます。マルチファイルが準備されているために
、ローカルファイル読み込みの例は//localhost/path/to/table.csv :: 

9月を:STR、デフォルト「」
区切り文字を指定します。あなたはパラメータを指定しない場合、それは、カンマを使用しようとします。区切り文字ではなく1つの文字「\ sの+」、パーサはパイソンを使用するよりも長いです。そして、カンマでデータを無視します。「\のR&LT \ T」:正規表現の例

DELIMITER:STR、デフォルトなし
区切り、デリミタ代わりに(このパラメータが指定されている場合、パラメータ9月故障)

delim_whitespace :.ブール、falseデフォルト
指定された空間(例えば、「」又は「」)をセパレータとして使用され、それ09月=を設定することと等価である「\ S +」。このパラメータが設定されている場合は、区切りの引数はトゥーレに失敗します。
新バージョンでは0.18.1でサポートされている

ヘッダ:intまたはintのリストを、デフォルトの「推測」
、データ線の数が使用された行数を指定した列名として始まりました。0のファイル名がリストされていない場合、それはデフォルトで、それ以外の場合はNoneに設定されています。あなたが明示的にヘッダを設定した場合= 0は、元の列名が存在して置き換えます。ヘッダパラメータは、例えば、リスト:列見出し(列毎に複数のタイトルを意味する)、介在する行は無視されるように[0,1,3]この文書は、例えば、本(これらの行のリストを示します実施例2;データ行が2,4ヘッダが多段として表示され、この場合、第3ライン)がデータフレームのデータライン5から始まり、廃棄されます。
注:skip_blank_lines = Trueのパラメータは、ヘッダのコメント行と空白行を無視し、第1行ヘッダー= 0は、データの最初の行ではなくファイルを表す場合。

名前:配列のような、デフォルトなし
列名の結果リスト、データファイルは、列ヘッダー行ではない場合、あなたはヘッダ=なしを実行する必要があります。デフォルトのリストには、trueに設定パラメータmangle_dupe_cols =ない限り、複製することはできません。

index_col:intまたは配列またはFalseは、デフォルトなし
行インデックスの複数のシーケンスが与えられた場合の列数は、行または列名のインデックスとして使用されます。
ファイルが不規則である場合は、行区切りの終わりがあり、最初のカラムとしてindex_col = Falseの行インデックスパンダを確保するように設定することができます。

usecols:アレイ状、デフォルトなし
(指定された列に対応することができる数)でなければならないファイルの位置に対応することができるリスト内のデータ値のサブセットを返していないか、文字の送信ファイルは、列名です。例えば:usecolsパラメータが有効であってもよい[0,1,2]または[ 'foo'で、 'バー' 、 'バズ']。このパラメータを使用すると、より速くロードし、メモリ消費量を削減することができます。

as_recarray:ブール値、Falseのデフォルトは
非推奨:このパラメータは、将来のバージョンで削除されます。.to_records pd.read_csv(...)()を代わりに使用してください。
numpyのデータフレームの代わりにrecarrayのリターン。このパラメータがTrueに設定されている場合。優先順位は、パラメータを圧迫します。そして、行インデックスは、インデックス列は無視され、使用できなくなりました。

スクイーズ:ブール、falseデフォルト
ファイルに値が含まれている場合、そのシリーズは返す

接頭辞:STR、デフォルトなし
列見出しが存在しない場合には、列にプレフィックスを追加しません。たとえば: 'X'はX0、X1、であることを追加しています...

mangle_dupe_cols:ブール値、デフォルト真の
列を複製、 'X' ... 'X'は'X.0' ... 'X.N'として表現されます。falseに設定されている場合には、ランク付けされ、すべての重いをカバーします。

DTYPE:タイプ名または列の辞書 - >タイプ、デフォルトなし
データ列のデータ・タイプごと。例えば{ 'A':np.float64、 'B':np.int32} 

エンジン:{ 'C'、 'Pythonは'}、任意
高速Pythonがされている間に使用するCエンジンエンジンのパーサは、現在よりfeature-エンジンです。完全な。
解析エンジン。Cは、選択やPythonされてもよいです。より完全なCエンジン高速だが、Pythonのエンジン機能。

コンバータ:辞書、デフォルトなし
列挙された変換辞書機能。キーは、列名または列番号を指定できます。

true_values:リスト、デフォルトなし
考えてみAS Trueに値

false_values:リストは、デフォルトなし
考えてみAS Falseに値はありません

ブール値は、falseデフォルト:skipinitialspace 
。(デフォルトではそれが無視されていない、Falseの)区切り文字を無視した後、空白

のskipRowsを:リスト状又は整数、デフォルトなし
(ファイルの先頭から数えて)無視される行の数、または行番号(0から始まる)のリストをスキップする必要があります。

skipfooter:int型、デフォルト0 
ファイルの末尾から省略スタート。(Cエンジンがサポートしていません)

skip_footer:int型、デフォルトの0が
推奨されていません:skipfooter、同じ機能を使用することをお勧めします。

NROWS:int型、デフォルトなし
行数が読み取られる(ファイルの日付の始まり)。

na_values:スカラー、STR、リスト-など、または辞書、デフォルトなし
NA / NaNでのを置き換えるために使用する値のセット。あなたは、パラメータ、特定の列にNULL値の必要性を渡す場合。デフォルトは'N / A '' NA '' NULL '' NaN 3を'' nan'`、1 IND# '' 1 A QNANの#'で

BOOL、デフォルトはTrue:Keep_default_na 
na_values指定されたパラメータであれば、そしてkeep_default_naは= Falseの場合、デフォルトのNaNはそれ以外の場合は追加し、上書きされます。

na_filter:ブール値、デフォルトはTrue 
欠損値(空の文字列またはnull)かどうかを確認してください。大きなファイルの場合、データセットはna_filter = Falseの場合、読み取り速度を向上させることができます設定NULL値、ではありません。

冗長:ブール値、Falseの既定
例えば、情報出力リゾルバの様々なを印刷するかどうか:「非欠損値の数を値]列に」などが挙げられます。

skip_blank_lines:ブール値、デフォルトはTrue 
Trueの場合、空白行をスキップし、そうでない場合はNaNと呼ばれます。

parse_dates:ブールまたはINTSリストの名前またはまたはまたはリストの辞書一覧のデフォルトはfalse 

ブール値TRUE - >分析指標を。
名前のリストやEGは、Ifをint型- > 1,2,3分析カラム[1、2 ,. 3]。独立した値の日付列として、
リストのリスト場合EG [1 ,. 3] - >列日付としてカラム3の併用。
辞書、EG { 'FOO':[1 ,. 3]} - > 1 、3を組み合わせ、および「foo」という名前の列に結合された
1。
2 
3。
4。
infer_datetime_format:ブールは、falseデフォルト
利用できる真とparse_datesに設定すると、パンダは日付タイプを変換しようと、もし変換変換することができますおよび分析方法。いくつかのケースでは5〜10倍高速化。

keep_date_col:ブール、falseデフォルト
接続日は複数の列を解析する場合、列には、接続維持関わります。デフォルトはFalseです。

date_parser:機能、デフォルトなし
機能はデフォルトdateutil.parser.parser変換を行う使用して、日付を解析するために使用されます。パンダは一方通行の下ですべての問題を解決しようとするには、3つの異なる方法があります使用することです。
パラメータとして(parse_datesによって指定された)は、1つまたは複数を使用して、1アレイ。
2.パラメータとしてマルチカラムカラムとして接続文字列、
3パラメータとして(parse_datesで示す)文字列を解析するために1回以上関数と呼ばれる各行date_parser。

dayfirst:ブール、falseデフォルト
日付型DD / MM形式の

、ブール値をfalseデフォルト:イテレータを
ブロックすることにより、ファイルブロックに返しますTextFileReaderオブジェクトを。

チャンクサイズ:int型、デフォルトなし
ファイルブロックのサイズ、よりinformationonイテレータとCHUNKSIZEのためのIOツールのドキュメントを参照してください。

圧縮:{ '推測'、 'gzipの'、 'BZ2'、 'ZIP'、 'XZ'、なし}、デフォルトの' 「推論する
ディスク上の圧縮ファイルを直接使用します。あなたは、GZIP、BZ2、ジッパーを使用して、引数の推論を使用するか、「.gzを」、「.bz2'にファイル名を解凍した場合は 」.zipファイル」、または『XZ』 これらのファイルをサフィックス、または開梱しないでください。あなたがジッパーを使用した場合、中国のZIPパッケージには、一つだけのファイルが含まれている必要があります。解凍はNoneに設定されていません。
新バージョン0.18.1バージョンはzipファイルをサポートしており、XZ解凍し

、数千:STR、デフォルトなし
「」等「」や千の区切り文字を

STR、デフォルト10進「」 
の文字が「を使用して小数点以下(例えば:欧州のデータであり、 「)。

float_precision:文字列、デフォルトはなし
Cエンジンのコンバータはオプションで浮動小数点値に使用するように指定しますが、往復のコンバータで経常コンバータのためのどれも、高精度コンバータでの高、およびRound_Tripません。。
指定

lineterminatorを:STR (長さ1)、なしデフォルト
のみCパーサー行区切りを、。

quotechar:STR(長さ1)、オプションの
引用符、スタート識別文字は、説明したように使用され、引用符内の区切り文字は無視されます。

引用:intまたはcsv.QUOTE_ *インスタンス、デフォルト0 
制御定数CSV引用符。またQUOTE_MINIMALは(0)、QUOTE_ALL、QUOTE_NONNUMERICは、(2)またはQUOTE_NONE(1)(3)

ダブルクォートは:ブールは、デフォルトの真の
単一引用符が定義されており、およびパラメータがQUOTE_NONEを引用されていないとして、二重引用符、二重引用符は、引用符をマークするとき要素の要素として使用します。

EscapeCharに:STR(長さ1)、デフォルトなし
引用区切り文字がそれほど制限されていない指定、QUOTE_NONEです。

コメント:STR、デフォルトなし
過剰行が解決されていない特定していません。文字が最初に表示された場合は、すべての行が無視されます。このパラメータは、文字、コメント行ヘッダとのskipRowsとして無視されている(skip_blank_lines = Trueのは同様の)空白行することができます。例えば、指定されたコメント=「#」解析なら「#emptyがBをNa \、C \ n1,2,3」 = 0ヘッダに戻され、結果はヘッダとして「B、C」であろう。

エンコーディング:STR、デフォルトなし
「UTF-8」。一般的に指定、文字セットのタイプを指定していないPython標準リストエンコーディングの

方言:STRまたはcsv.Dialectインスタンス、なしデフォルト
つ以上の文字が無視SEP場合、特定の言語は、指定されていない場合。ビューcsv.Dialect特定の文書

tupleize_cols:ブールは、falseデフォルト
ON IS ASタプルの休職A一覧に列を(のために変換するためのデフォルトはONで列にマルチインデックスです)

error_bad_lines:ブール値、デフォルトはTrue 
ラインがあまりにも多くの列が含まれている場合、デフォルトでは場合は、データフレームを返しませんfalseに設定され、それは(のみCパーサーで)削除流用されます。

warn_bad_lines:ブール値、デフォルトはTrue
error_bad_lines場合= Falseを、そしてwarn_bad_lines = trueの場合、すべての「悪い行が」出力(のみCパーサで利用可能)になります。

low_memory:ブール値、デフォルト真の
ブロックがメモリにロードされ、その後、低メモリ消費量が解析されます。しかし、発生する可能性のある混乱のタイプ。その型を確実混同しないようにはFalseに設定する必要があります。DTYPE引数は、タイプまたは使用することを指定します。チャンクサイズの使用を注意してくださいまたはタイプ(Cパーサでのみ有効)無視して、イテレータパラメータブロック読みメンバーシップは、データフレームの中にファイル全体を読み込みます

buffer_lines:デフォルトなしはint型を
お勧めしませんが、このパラメータは将来のバージョンに移行します彼の値はパーサーでの使用は推奨されていないためだけでなく、

compact_ints:ブール、デフォルトはfalse 
お勧めしません、このパラメータは将来のバージョンで削除されます
、あなたがcompact_intsを設定した場合= Trueの場合、任意の整数型のリストは、最小に従って構築されますストレージの整数型、署名use_unsignedパラメータがいるかどうかに依存します

use_unsigned:ブール値を、falseデフォルト
はお勧めしませんが:このパラメータは将来のバージョンで削除されます
整数列が圧縮されている場合(つまりcompact_ints = true)を、指定された列が圧縮されています符号付きまたは符号なし。
memory_map:ブール、デフォルトはFalse
あなたはメモリ内のファイルを使用している場合は、直接ファイルをマップします。再度ファイルIO操作を避けるために、この方法を使用します。

To_csv 2.  
to_csvメソッドの定義:

DataFrame.to_csv(path_or_buf =なし、9月= ''で、na_rep = ''、float_format =なし、柱=なし、
ヘッダ=真、インデックス=真、index_label =なし、MODE = '' W、エンコーディング=なし、圧縮=なし、
引用=なし、quotechar = '「'、line_terminator = '\ N-'、チャンク=なし、tupleize_cols =なし、
DATE_FORMAT =なし、ダブルクォート=真、EscapeCharに=なし、小数= '。')
。1 
2 
。3 
。4 
。5 
path_or_buf =なし:文字列ファイルまたはハンドル、デフォルトなし
結果がNONE提供されている場合、ファイルオブジェクトまたはパスは、文字列が返されるようになります。
文字列やファイルハンドルは、デフォルトのファイル
がない結果であれば、パスやオブジェクト、これは、文字列として返されます。

9月には:文字、デフォルトの」、 
デフォルトの文字「」
出力ファイルの区切りのフィールド。

na_rep:文字列、デフォルト「」 
欠落データ表現
文字列、デフォルトは
浮動小数点フォーマット文字列の

文字列、デフォルトはなし:float_format 
浮動小数点数のフォーマット文字列
文字列なしデフォルトの
浮動小数点形式の文字列

の列:シーケンス、書くためのオプションの列の
順序を、オプションの列書き込み

ヘッダ:文字列またはブール値のリスト、真のデフォルト
。書き込み列名の場合OUT文字列のリストでは、ITがでカラム名のエイリアスであると仮定される指定され
た文字列またはブールリスト、デフォルトはtrueです
列名の書き込み。文字列のリストを考えると、それはエイリアス列名を想定しています。

インデックス:ブール値、デフォルトはTrue 
書き込み行名(インデックス)
トゥーレデフォルトはことをブール値
行名を書き込み(インデックス)
 
index_label:文字列またはシーケンス、またはFalse、デフォルトなし
インデックス列(複数可)の列ラベルなしが指定されていない場合。必要であれば、ヘッダとインデックスが真、その後、インデックス名が使用されている。データフレームは、マルチインデックスを使用している場合のシーケンスが与えられるべきである。インデックス名のフィールドを印刷しないFalseの場合。index_label =簡単にインポートするための偽の使用 Rの中
の文字列またはシーケンス、またはFalse、デフォルトはNoneです
必要に応じて、列がインデックス列のラベルを使用することができます。与えられた、とタイトルとインデックスはtrue、そうでない場合は、インデックス名を使用します。データファイルが複数のインデックスを使用している場合は、このシーケンスを使用する必要があります。値がFalseの場合、インデックスフィールドを印刷しません。Index_labelは、R = Falseを簡単に紹介インデックスで使用される。

MODEは:STRの
モード:値「str」は、文字列の
Pythonの書き込みモード、「W」のデフォルト

エンコーディング:文字列、オプションの
コーディング:文字列、オプションは、
出力ファイルを表しこれは、デフォルトの「UTF-8」などのデフォルトの「ASCII」とPython 3のように、Pythonの2をエンコードされた文字列を使用しています。

圧縮:文字列、オプションの
文字列、オプション
の出力ファイルで使用される圧縮文字列の、値「GZIPを」許可「BZ2」、 「XZ」、 唯一の最初の引数はファイル名です。

line_terminator:文字列、デフォルトの「\ nは 」 
文字列、デフォルトは「\ n」は
、出力ファイルで使用されている文字の改行文字またはシーケンス

引用:csvモジュールからのオプションの一定の
オプションモジュールのCSV一定の
デフォルト値to_csv.QUOTE_MINIMAL。あなたは浮動小数点形式を設定した場合、浮動小数点を文字列に変換されるので、csv.QUOTE_NONNUMERICは非数値として扱います。

quotechar:文字列(長さ1)、デフォルトの「「」 
文字列(長さ1)、デフォルトは"" 
文字フィールドを参照するために使用され

たダブルクォートを:ブール、デフォルトはTrue 
ブール値、デフォルトのトゥーレの
フィールド内の制御quotechar 

EscapeCharに:文字列(長さ1)なしのデフォルトの
長さ1の文字列()、デフォルトはNoneです
脱出し、9月の文字をquotecharするための適切な時点で

チャンクサイズ:なしまたはint型
int型なしまたは
書き込み線

tupleize_cols:ブール、falseデフォルトん
ブール値を、デフォルトは偽され
たマルチインデックスCSVファイルのこのパラメータは削除され、常に書き込まれます各行別の行:バージョンリリース0.21.0から削除します
(値がfalseの場合)複数のインデックス(TRUEの場合)または新しい、拡張フォーマットをタプルのリストとして欄に記載されている、インデックス列の複数の各々は、CSVの行です。

DATE_FORMAT:文字列、デフォルトなし
文字列デフォルトはなしで
、日付時刻オブジェクトにStringオブジェクト

「」文字列、デフォルトの10進
文字列、デフォルトの」。
小数点区切り文字として文字認識。たとえば。欧州のデータ使用"

  

おすすめ

転載: www.cnblogs.com/SunshineKimi/p/10960226.html