インポートPANDAS AS PD から sklearn.decomposition インポートPCA #データ住所:HTTPS://www.kaggle.com/c/instacart-market-basket-analysis/data #テーブルを読み込む 前= pd.read_csv(R&LT " E:\ 360Downloads \ SOFTWARE \次元削減列のテキストデータ\ order_products__prior.csv " ) 製品 = pd.read_csv(R&LT " E:\ 360Downloads \ SOFTWARE \次元削減列のテキストデータ\ products.csv " ) 受注 = pd.read_csv(R&LT " E :\ 360Downloads \ SOFTWARE \次元削減カラムテキストデータ\ order.csv " ) 通路 = pd.read_csv(R&LT " E:\ 360Downloads \ SOFTWARE \次元削減カラムテキストデータ\ aisles.csv " ) #マージテーブルは、その列によってprodyct_idを合わせ _MG = pd.merge(以前は、製品、ON = [ ' prodyct_id '、' PRODUCT_ID ' ]) _MG = pd.merge(_MG、注文、ON = [ ' ORDER_ID '、' ORDER_ID ' ]) MT = pd.merge(_MG、通路、ON = [ ' aisle_id ' ' aisle_id ' ]) #クロステーブルを使用して、ユーザを構築-後製品カテゴリテーブルの クロス= pd.crosstab(MT [ ' USER_ID ' ]、 MT [ ' アイル' ]) #主成分分析は、商品の冗長なカテゴリを除外しないように、またはほとんど誰も除外する商品カテゴリの少量を購入しようとしている PCA = PCA(n_components = 0.9 ) データ = pca.fit_transform(クロス)