02仕上げPython10、パンダ

外部データの取り込み統一フォーマット:
 
read_x()  - Xをインポートするファイルのフォーマットを示し
 
インポート の.xlsx ファイル
PD。 read_excel R "C:\ Users \ユーザーtest.xlsx")
PD。 read_excel ( "C:/users/test.xlsx")
シート名 =「Sheet1のは」/ 0--そのシートを指定します
index_col = 0 -指定行インデックス
ヘッダ = 0 -指定列インデックス
usecols = [0,2] -インポート列が指定され
インポート .CSV ファイル
PD。 read_csv (R "C:\ Users \ユーザーのtest.CSV")
9月には =「」 -指定された区切り文字、例えば「」スペース、\ tタブ
NROWS = 2 -読み出し行の数
コード =「UTF-8」/「GBK」 -コードのフォーマットを指定します
インポート .txtの ファイル
PD。 read_table (......)
9月=「」 - 区切り文字を指定する必要
インポート .SQL ファイル
PD。 read_sql (SQL、CON) 
問い合わせへの#sql、詐欺接続します
下記の特定の備考

 

備考:

1.SQLデータ:ステップ1:第二段階に接続されたPythonのデータベース:使用Pythonは、SQLクエリを実行します

#导入pymysql模块
import pymysql

#创建连接
eng = pymysql.connect(host='localhost',user='user','password'='passwd',db='db',charset='utf8')

# user:用户名
# password:密码
# host:数据库地址/本机使用localhost
# db:数据库名
# charset:数据库编码,一般为utf-8

#连接好后
pd.read_sql(sql,con)

**************************************************************************
sql = "SELECT * FROM talbe1"
eng = pymysql.connect("118.190.120.310",'zhangjh','123456','test',charset='utf8')
df = pd.read_sql(sql,eng)

 

2.ファイル・パスは、中国が含まれている - エンジンパラメータを設定することにより、

例えば:DF1 = pd.read_csv(R "C \ユーザー\新しいフォルダ\のtest.CSV"、enginge = "パイソン"、エンコード= "UTF-8-SIG")

フォーマットUTF-8-SIG / GBK符号化のPythonに解析言語、

 


一般的に使用される機能のデータに泊まりました

 

.head() - 数行のプレビュー

.shape() - データ・テーブル・サイズ注意を取得する:回数を含め、行と列のインデックスを入れていません

()の.info - データ型を取得

.describe() - 分布(平均、最も値、分散など)のすべての数値フィールドの値を取得

 


データのエクスポート:

  • .xlsx形式へのエクスポート

            to_excel() 

df.to_excel(excel_writer = r"C:\user\desktop\blabla.xlsx", sheet_name="测试文档", index=True)

            エクスポート列に列を設定する形式のエンコード=「UTF-8」コード配置しました  

            欠損値na_rep = 0無限値処理inf_rep = 0     

df.to_excel(excel_writer = r"C:\user\desktop\blabla.xlsx", sheet_name="测试文档", index=True, encoding="uft-8", na_rep=0,inf_rep=0)

            複数のシートにファイルをエクスポートします。

使用済みexcelwriter()

#excelpath为文件要存放的路径
writer = pd.ExcelWriter(excelpath, engine="xlsxwriter")

#分别将表df1,df2,df3写入Excel中的sheet1,sheet2,sheet3并命名为表1、表2、表3
df1.to_excel(writer,sheet_name = "表1")
df2.to_excel(writer,sheet_name = "表2")
df3.to_excel(writer,sheet_name = "表3")

#保存写入内容
writer.save()

  

  • .csv形式へのエクスポート

            to_csv() 

df.to_csv(path_or_buf = r"C:\user\desktop\blabla.csv", index=True, columns=['bla1','bla2'],sep=',', na_rep=0,inf_rep=0,encoding="utf-8-sig")

           あなたは、セパレータ9月=を複数設けてもよい「」空間符号化フォーマットは、 『UTF-8-SIG』 / 『GBK』 UTF-8-sigが歪み中国語を防ぐは、一般に

公開された56元の記事 ウォンの賞賛0 ビュー769

おすすめ

転載: blog.csdn.net/xiuxiuxiu666/article/details/104317018