第四节数据降维案列 - 代码天地

第四节数据降维案列

其他 2020-03-26 00:17:28 阅读次数: 0

import pandas as pd
from sklearn.decomposition import PCA

# 数据地址：https://www.kaggle.com/c/instacart-market-basket-analysis/data
# 读取表
prior = pd.read_csv(r"E:\360Downloads\Software\降维案列数据\order_products__prior.csv")
products = pd.read_csv(r"E:\360Downloads\Software\降维案列数据\products.csv")
order = pd.read_csv(r"E:\360Downloads\Software\降维案列数据\order.csv")
aisles = pd.read_csv(r"E:\360Downloads\Software\降维案列数据\aisles.csv")

# 合并表，prodyct_id按该列合并
_mg = pd.merge(prior, products, on=['prodyct_id', 'product_id'])
_mg = pd.merge(_mg, order, on=['order_id', 'order_id'])
mt = pd.merge(_mg, aisles, on=['aisle_id', 'aisle_id'])

# 使用交叉表，构造用户-购买商品类别表
cross = pd.crosstab(mt['user_id'], mt['aisle'])

# 进行主成分分析，将冗余的商品类别过滤掉，即将少量或者几乎没有人购买的商品类别过滤掉
pca = PCA(n_components=0.9)
data = pca.fit_transform(cross)

猜你喜欢

转载自www.cnblogs.com/kogmaw/p/12571637.html

第四节数据降维案列

第四节 python数据结构

EasyUI 数据表格（DataGrid）——第四节

第四节 pandas 数据加载

python数据类型（数值）第四节

第四节抽象数据类型

第四节：SQLServer数据类型详解

第四节：变量常量与数据类型

第四节——容器数据卷

【大数据入门笔记系列】第四节 Hdfs读数据处理流程

【大数据入门笔记系列】第四节 NameNode元数据缓存机制

第四节 Go数据结构之栈

第四节 python数据运算和流程控制

python爬虫入门之————————————————第四节--使用bs4语法获取数据

Java后端爱上SpringBoot 第四节:SpringBoot多数据源

第四节 wxml盒子布局，事件监听，不同页面数据传输

第一章第四节数据编码——丁老师

第二章：第四节数据可视化-课程

EEGLAB合辑 | 第四节提取数据周期

分布式事务数据库 —-MySQL 数据库开发规范(第四节)

【Spark2运算效率】第四节影响生产集群运算效率的原因之数据倾斜

第四节

第四节:

第四节：

余老师带你学习大数据-Spark快速大数据处理第五章第四节HiveQL数据定义

余老师带你学习大数据-Spark快速大数据处理第六章第四节Spark案例

余老师带你学习大数据-Spark快速大数据处理第二章第四节zookeeper分布式锁

余老师带你学习大数据-Spark快速大数据处理第十章Kafka第四节Kafka-Admin

【php增删改查实例】第四节 -自己 DIY 一个数据库管理工具

余老师带你学习大数据框架全栈第十一章Flink第四节Standalone模式下提交job

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)