《利用Python进行数据分析》 13.1pandas与建模代码的结合

移动开发 2019-02-18 15:01:43 阅读次数: 0

第十三章 Python建模库介绍

13.1 pandas与建模代码的结合

使用pandas用于数据载入和数据清洗，之后切换到模型库去建立模型是一个常见的模型开发工作流。

在机器学习中，特征工程是模型开发的重要部分之一。特征工程是指从原生数据集中提取可用于模型上下文的有效信息的数据转换过程或分析，书中会展示一些可以在利用pandas进行数据操作和建模之间无痛切换的方法。

1.panas和其他分析库的结合点通常是NumPy数组。

要将DataFrame转换为NumPy数组，使用．values属性（见图13-1）

图13-1：DataFrame转换为数组

2.values属性一般在你的数据是同构化的时候使用——例如，都是数字类型的时候。如果你的数据是异构化的，结果将是Python对象的ndarray。（见图13-2）

图13-2：异构化数据

3.使用loc索引和values，选取一部分列（见图13-3）

图13-3：选取部分列输出

注：有些库对pandas有本地化支持，可以自动为你做以下工作：将数据从DataFrame转换到NumPy中并将模型参数名称附于输出表的列或Series上。在其他情况下，你将不得不手动去处理这些“元数据管理”的操作。

4.pandas的Categorical类型和pandas.get_dummies函数。

假设在我们的示例数据集中，我们有一个非数字类型的列（见图13-4）

图13-4：Categorical类型和pandas.get_dummies函数

注：在使用虚拟变量拟合特定的统计模型时是有一些细微区别的。当你拥有不止简单的数字类型列时，使用Patsy（下一节的内容）可以更简单、更少出错。

猜你喜欢

转载自blog.csdn.net/weixin_33738555/article/details/87231581

《利用Python进行数据分析》 13.1pandas与建模代码的结合

pandas-利用python进行数据分析

利用Python进行数据分析——pandas入门

利用Python进行数据分析——Pandas

利用Python进行数据分析之pandas

【利用python进行数据分析】pandas入门

利用Python进行数据分析--Pandas(1)

《利用Python进行数据分析》---pandas入门

利用Python进行数据分析-Pandas

《利用Python进行数据分析》---pandas入门2

利用python进行数据分析—五、pandas入门

利用pandas进行数据分析

《利用Python进行数据分析》第5章 pandas的数据汇总与处理缺失数据

[Python] 9.利用Python进行数据分析-挖掘建模(无监督学习)

利用python进行数据分析——第13章 python建模库介绍

python pandas入门总结——《利用Python进行数据分析》

《利用Python进行数据分析》第五章-pandas的数据结构介绍

利用Python进行数据分析_Pandas_处理缺失数据

利用pandas对初创公司进行数据分析

《利用Python进行数据分析》13.2 使用Patsy创建模型描述

利用Python进行数据分析（十三）之Pandas的绘图函数

pandas入门《利用Python进行数据分析》读书笔记第5章

《利用Python进行数据分析》第五章 pandas的基本功能

利用Python进行数据分析（3）：第4章，Pandas入门

《利用python进行数据分析》读书笔记--第五章 pandas入门

[利用python进行数据分析书笔记]第5章 pandas入门

《利用Python进行数据分析·第2版》第5章 pandas入门

利用Python进行数据分析：【Pandas】（Series+DataFrame）

《利用Python进行数据分析·第2版》第12章 pandas高级应用

《利用python进行数据分析》之pandas中index入门

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)