[パンダ]の研究では、190802を締結しました

パンダの研究では、190802を締結しました

パンダは、データのいくつかのセットで扱われてきた、と常に、(Wulian)I最近使用した関数は、ノートの初心者とみなすことができるものの少し要約を確認し、今使用しないように、この機会を利用したいと思います。

  • read_csv
    • これは私がCSVファイルから読み込むために使用されるほぼすべての時間です。CSVファイルの一部には、ヘッダーを設定することはできませんしましたheader=None
    • また、本日は、対応するread_excelがあり、XLSファイルに会いました。
    • 今日は、また、文字化けしている参照のExcelを使用して符号化関連、通常UTF-8でエンコードされたファイルの問題の数に関連して、コードに関するメモ帳の順番を経由して、手動でその前に、CSVファイルを直接read_csvを使用することはできませんにするためにExcelを使用し何とかUTF-8を読み取ることができるトランスコードが、歪み。Excelのエンコード形式は、ANSIので、ちょうど追加し、encoding='ansi'缶を。
  • リスト(DF)
    • あなたは、他のブログで今日見たヘッダデータフレームに非常に簡単な方法を取得します。それはリストのパイソン、各列ヘッダを返します。
  • 場所
    • これは非常に一般的な方法のデータフレームのアクセスで、その内容を変更することができます。loc[]numpyのは、使用することは非常に似ていますが、問題は2の前に直面しました。
      • 最初は、LOCのインデックスを使用してはならない、が、ヘッダ・タグは、このような問題は、多くの場合、ヘッダの場合に生じるNoneでありません。
      • 第二は、この断片は[A、B]、numpyの代わりに[B)であることです。
  • ToListメソッド()
    • 直接リストのpythonにデータフレームパンダから変換するには、データフレームには、この方法を使用します。
  • sort_values
    • ここでは、一定のルールに従ってソートすることができます。ここで、軸=ラベル軸をソートするように配置され、軸= 0、行ラベルではなく、列を示します。= []これらのラベルの種類を表します。あなたはソートする複数のタグを使用したい場合は、それがCPU時間を考慮していないだけで、私は、この関数の内部使用が不安定なものです見積もるために、彼らはまだ直接=によって書かれたラベルの後ろの混乱になります、小隊最善ではありませんリストには、することができます。
    • ここでも、デフォルトでは、必要な直接変更を設定できるのであれば、戻り値を変更するための場所ではありませんinplace=True一方、設定はFalse、それ以外の場合は昇順、降順、昇順が。

おすすめ

転載: www.cnblogs.com/realmagicjim/p/11291493.html