データ分析の一般的なスキルと経験の要約

1. Pandasは、dateimeタイプを文字列としてフォーマットします

パンダには多くのデータタイプがあり、そのうちの1つは日時、つまり日付と時刻です。たとえばTimestamp(‘2020-09-22 20:43:00’)、これはタイムスタンプタイプであることを意味します。多くの場合、日付または時刻を取得するには文字列に変換する必要があります。文字列を取得できるstrftime()場合strftime('%Y-%m-%d')その呼び出しメソッド2020-09-22
パンダのDataFrameでは、通常、列全体が置き換えられます。現時点でapplyは、次のようにラムダ式とメソッドが必要です

order_detail['date'] = order_detail['date'].apply(lambda x:x.strftime('%Y-%m-%d'))

日時タイプを指定された形式の文字列に完成させることができます。

2.Pandasは.sqlファイルを読み取ります

パンダやサポートされている形式でデータを読み取る方法は、データベースデータの読み取りなど、さまざまですが、通常、.sqlファイルを直接読み取ることはできません。代わりに、通常、.sqlファイルでSQLステートメントを実行してデータをMySQLデータベースにインポートしてから、パンダを使用します。データベースからデータを読み取ります。
通常、NavicatやSQLYogなどのデータベース視覚化ツールを使用して.sqlファイルのSQLステートメントを実行できます。ここでは、次のようにNavicatを例として.sqlファイルのデータをインポートします。
navicatインポートデータ
次に、Pythonを使用してデータベースからデータを読み取ります。

import pandas as pd
import pymysql

sql = 'select * from table_name' # 换成自己的表名

con = pymysql.connect(host='127.0.0.1', port=3306,user='root',password='root',database='python_da',charset='gbk') # 换成自己的数据库
order_detail = pd.read_sql(sql,con)

mymysqlライブラリがない場合は、実行pip install pymysqlまたはconda install pymysqlインストールできます

おすすめ

転載: blog.csdn.net/CUFEECR/article/details/108740720