パンダの研究では、190802を締結しました
パンダは、データのいくつかのセットで扱われてきた、と常に、(Wulian)I最近使用した関数は、ノートの初心者とみなすことができるものの少し要約を確認し、今使用しないように、この機会を利用したいと思います。
- read_csv
- これは私がCSVファイルから読み込むために使用されるほぼすべての時間です。CSVファイルの一部には、ヘッダーを設定することはできませんしました
header=None
。 - また、本日は、対応するread_excelがあり、XLSファイルに会いました。
- 今日は、また、文字化けしている参照のExcelを使用して符号化関連、通常UTF-8でエンコードされたファイルの問題の数に関連して、コードに関するメモ帳の順番を経由して、手動でその前に、CSVファイルを直接read_csvを使用することはできませんにするためにExcelを使用し何とかUTF-8を読み取ることができるトランスコードが、歪み。Excelのエンコード形式は、ANSIので、ちょうど追加し、
encoding='ansi'
缶を。
- これは私がCSVファイルから読み込むために使用されるほぼすべての時間です。CSVファイルの一部には、ヘッダーを設定することはできませんしました
- リスト(DF)
- あなたは、他のブログで今日見たヘッダデータフレームに非常に簡単な方法を取得します。それはリストのパイソン、各列ヘッダを返します。
- 場所
- これは非常に一般的な方法のデータフレームのアクセスで、その内容を変更することができます。
loc[]
numpyのは、使用することは非常に似ていますが、問題は2の前に直面しました。- 最初は、LOCのインデックスを使用してはならない、が、ヘッダ・タグは、このような問題は、多くの場合、ヘッダの場合に生じるNoneでありません。
- 第二は、この断片は[A、B]、numpyの代わりに[B)であることです。
- これは非常に一般的な方法のデータフレームのアクセスで、その内容を変更することができます。
- ToListメソッド()
- 直接リストのpythonにデータフレームパンダから変換するには、データフレームには、この方法を使用します。
- sort_values
- ここでは、一定のルールに従ってソートすることができます。ここで、軸=ラベル軸をソートするように配置され、軸= 0、行ラベルではなく、列を示します。= []これらのラベルの種類を表します。あなたはソートする複数のタグを使用したい場合は、それがCPU時間を考慮していないだけで、私は、この関数の内部使用が不安定なものです見積もるために、彼らはまだ直接=によって書かれたラベルの後ろの混乱になります、小隊最善ではありませんリストには、することができます。
- ここでも、デフォルトでは、必要な直接変更を設定できるのであれば、戻り値を変更するための場所ではありません
inplace=True
。一方、設定はFalse、それ以外の場合は昇順、降順、昇順が。