外部データの取り込み統一フォーマット:
read_x()
- Xをインポートするファイルのフォーマットを示し
インポート
の.xlsx
ファイル
|
PD。
read_excel
(
R
"C:\ Users \ユーザーtest.xlsx")
PD。
read_excel
( "C:/users/test.xlsx")
|
シート名
=「Sheet1のは」/ 0--そのシートを指定します
index_col
= 0 -指定行インデックス
ヘッダ
= 0 -指定列インデックス
usecols
= [0,2] -インポート列が指定され
|
インポート
.CSV
ファイル
|
PD。
read_csv
(R "C:\ Users \ユーザーのtest.CSV")
|
9月には
=「」 -指定された区切り文字、例えば「」スペース、\ tタブ
NROWS
= 2 -読み出し行の数
コード
=「UTF-8」/「GBK」 -コードのフォーマットを指定します
|
インポート
.txtの
ファイル
|
PD。
read_table
(......)
|
9月=「」 - 区切り文字を指定する必要
|
インポート
.SQL
ファイル
|
PD。
read_sql
(SQL、CON)
問い合わせへの#sql、詐欺接続します
|
下記の特定の備考 |
備考:
1.SQLデータ:ステップ1:第二段階に接続されたPythonのデータベース:使用Pythonは、SQLクエリを実行します
#导入pymysql模块
import pymysql
#创建连接
eng = pymysql.connect(host='localhost',user='user','password'='passwd',db='db',charset='utf8')
# user:用户名
# password:密码
# host:数据库地址/本机使用localhost
# db:数据库名
# charset:数据库编码,一般为utf-8
#连接好后
pd.read_sql(sql,con)
**************************************************************************
sql = "SELECT * FROM talbe1"
eng = pymysql.connect("118.190.120.310",'zhangjh','123456','test',charset='utf8')
df = pd.read_sql(sql,eng)
2.ファイル・パスは、中国が含まれている - エンジンパラメータを設定することにより、
例えば:DF1 = pd.read_csv(R "C \ユーザー\新しいフォルダ\のtest.CSV"、enginge = "パイソン"、エンコード= "UTF-8-SIG")
フォーマットUTF-8-SIG / GBK符号化のPythonに解析言語、
一般的に使用される機能のデータに泊まりました
.head() - 数行のプレビュー
.shape() - データ・テーブル・サイズ注意を取得する:回数を含め、行と列のインデックスを入れていません
()の.info - データ型を取得
.describe() - 分布(平均、最も値、分散など)のすべての数値フィールドの値を取得
データのエクスポート:
-
.xlsx形式へのエクスポート
to_excel()
df.to_excel(excel_writer = r"C:\user\desktop\blabla.xlsx", sheet_name="测试文档", index=True)
エクスポート列に列を設定する形式のエンコード=「UTF-8」コード配置しました
欠損値na_rep = 0無限値処理inf_rep = 0
df.to_excel(excel_writer = r"C:\user\desktop\blabla.xlsx", sheet_name="测试文档", index=True, encoding="uft-8", na_rep=0,inf_rep=0)
複数のシートにファイルをエクスポートします。
使用済みexcelwriter()
#excelpath为文件要存放的路径
writer = pd.ExcelWriter(excelpath, engine="xlsxwriter")
#分别将表df1,df2,df3写入Excel中的sheet1,sheet2,sheet3并命名为表1、表2、表3
df1.to_excel(writer,sheet_name = "表1")
df2.to_excel(writer,sheet_name = "表2")
df3.to_excel(writer,sheet_name = "表3")
#保存写入内容
writer.save()
-
.csv形式へのエクスポート
to_csv()
df.to_csv(path_or_buf = r"C:\user\desktop\blabla.csv", index=True, columns=['bla1','bla2'],sep=',', na_rep=0,inf_rep=0,encoding="utf-8-sig")
あなたは、セパレータ9月=を複数設けてもよい「」空間符号化フォーマットは、 『UTF-8-SIG』 / 『GBK』 UTF-8-sigが歪み中国語を防ぐは、一般に