第四次元削減例を見て

インポートPANDAS AS PD
 から sklearn.decomposition インポートPCA 

データ住所:HTTPS://www.kaggle.com/c/instacart-market-basket-analysis/data テーブルを読み込む 
前= pd.read_csv(R&LT " E:\ 360Downloads \ SOFTWARE \次元削減列のテキストデータ\ order_products__prior.csv " 
製品 = pd.read_csv(R&LT " E:\ 360Downloads \ SOFTWARE \次元削減列のテキストデータ\ products.csv " 
受注 = pd.read_csv(R&LT " E :\ 360Downloads \ SOFTWARE \次元削減カラムテキストデータ\ order.csv " 
通路 = pd.read_csv(R&LT " E:\ 360Downloads \ SOFTWARE \次元削減カラムテキストデータ\ aisles.csv " 

マージテーブルは、その列によってprodyct_idを合わせ 
_MG = pd.merge(以前は、製品、ON = [ ' prodyct_id '' PRODUCT_ID ' ])
_MG = pd.merge(_MG、注文、ON = [ ' ORDER_ID '' ORDER_ID ' ])
MT = pd.merge(_MG、通路、ON = [ ' aisle_id ' ' aisle_id ' ]) 

クロステーブルを使用して、ユーザを構築-後製品カテゴリテーブルの 
クロス= pd.crosstab(MT [ ' USER_ID ' ]、 MT [ ' アイル' ]) 

主成分分析は、商品の冗長なカテゴリを除外しないように、またはほとんど誰も除外する商品カテゴリの少量を購入しようとしている 
PCA = PCA(n_components = 0.9 
データ = pca.fit_transform(クロス)

 

おすすめ

転載: www.cnblogs.com/kogmaw/p/12571637.html