このコードは示しています。
- プレーンテキストファイルを読み込むためのパンダ
- csvファイルを読みます
- TXTファイルを読みます
- パンダはXLSXファイル形式をエクセル読みます
- MySQLのデータテーブルは、パンダを読みます
import pandas as pd
1、プレーンテキストファイルを読むために
1.1デフォルトのタイトル行、カンマ区切りを使用して、CSVを読み込みます
fpath = "./datas/ml-latest-small/ratings.csv"
# 使用pd.read_csv读取数据
ratings = pd.read_csv(fpath)
# 查看前几行数据
ratings.head()
|
ユーザーID |
MOVIEID |
格付け |
タイムスタンプ |
0 |
1 |
1 |
4.0 |
964982703 |
1 |
1 |
3 |
4.0 |
964981247 |
2 |
1 |
6 |
4.0 |
964982224 |
3 |
1 |
47 |
5.0 |
964983815 |
4 |
1 |
50 |
5.0 |
964982931 |
# 查看数据的形状,返回(行数、列数)
ratings.shape
(100836, 4)
# 查看列名列表
ratings.columns
Index(['userId', 'movieId', 'rating', 'timestamp'], dtype='object')
# 查看索引列
ratings.index
RangeIndex(start=0, stop=100836, step=1)
# 查看每列的数据类型
ratings.dtypes
userId int64
movieId int64
rating float64
timestamp int64
dtype: object
1.2独自の区切り文字、列名を指定して、TXTファイルを読み込みます
fpath = "./datas/crazyant/access_pvuv.txt"
pvuv = pd.read_csv(
fpath,
sep="\t",
header=None,
names=['pdate', 'pv', 'uv']
)
pvuv
|
pdate |
PV |
紫外 |
0 |
2019年9月10日 |
139 |
92 |
1 |
2019年9月9日 |
185 |
153 |
2 |
2019年9月8日 |
123 |
59 |
3 |
2019年9月7日 |
65 |
40 |
4 |
2019年9月6日 |
157 |
98 |
5 |
2019年9月5日 |
205 |
151 |
6 |
2019年9月4日 |
196 |
167 |
7 |
2019年9月3日 |
216 |
176 |
8 |
2019年9月2日 |
227 |
148 |
9 |
2019年9月1日 |
105 |
61 |
2、Excelファイルを読み込みます
fpath = "./datas/crazyant/access_pvuv.xlsx"
pvuv = pd.read_excel(fpath)
pvuv
|
日付 |
PV |
紫外 |
0 |
2019年9月10日 |
139 |
92 |
1 |
2019年9月9日 |
185 |
153 |
2 |
2019年9月8日 |
123 |
59 |
3 |
2019年9月7日 |
65 |
40 |
4 |
2019年9月6日 |
157 |
98 |
5 |
2019年9月5日 |
205 |
151 |
6 |
2019年9月4日 |
196 |
167 |
7 |
2019年9月3日 |
216 |
176 |
8 |
2019年9月2日 |
227 |
148 |
9 |
2019年9月1日 |
105 |
61 |
3、MySQLデータベースを読みます
import pymysql
conn = pymysql.connect(
host='127.0.0.1',
user='root',
password='12345678',
database='test',
charset='utf8'
)
mysql_page = pd.read_sql("select * from crazyant_pvuv", con=conn)
mysql_page
|
pdate |
PV |
紫外 |
0 |
2019年9月10日 |
139 |
92 |
1 |
2019年9月9日 |
185 |
153 |
2 |
2019年9月8日 |
123 |
59 |
3 |
2019年9月7日 |
65 |
40 |
4 |
2019年9月6日 |
157 |
98 |
5 |
2019年9月5日 |
205 |
151 |
6 |
2019年9月4日 |
196 |
167 |
7 |
2019年9月3日 |
216 |
176 |
8 |
2019年9月2日 |
227 |
148 |
9 |
2019年9月1日 |
105 |
61 |
この記事のコードアドレス:https://github.com/peiss/ant-learn-pandas