数据分析学习—使用Pandas进行数据分析

编程语言 2018-04-19 12:24:33 阅读次数: 2

数据分析学习—使用Pandas进行数据分析

在对数据进行分析时，首先需要了解相关的名词在该行业里的含义，即查阅相关知识对题目进行整体把握。

下面是进行数据分析的步骤：

1、读取数据
import pandas as pd
data = pd.read_csv("data/train.csv")
2、对数据进行预处理

具体包括：

（1）、剔除空白值超过一半的列
 half_count = len(data)/2
 data = data.dropna(thresh=half_count, axis=1)
（2）、剔除值完全相同的列
 data = data.drop(['exm1'], axis=1)
(3)、剔除与预测值相关性不大的列
 data = data.drop(['exm2', 'exm3'], axis=1)
(4)、对非数值列使用数值进行替换
status_replace1 = {
        "grade": {
            "A": 0,
            "B": 1,
            "C": 2,
            "D": 3,
            "E": 4
        }
    }
    data = data.replace(status_replace1)
（5）、对某些存在空白值的列进行删除或填充

删除：
data = data.dropna(axis=0)
填充：
data = data.fillna(0)  # 使用0值填充，还有其他填充方式，在此不做赘述
（6）、选择训练属性和label值
    x = data.iloc[:, 0: 5].as_matrix()

    # 结果标签
    y = data.iloc[:, 6].as_matrix()
(7)、初始化模型并进行训练
    lr = LR()
    lr.fit(x, y)
（8）、获取模型得分并对test.csv进行预测
   lr.score()
   lr.predict(x1)
以上就是我所总结的使用Pandas和Logistic Regression进行数据分析的步骤。

猜你喜欢

转载自blog.csdn.net/github_39611196/article/details/80003038

数据分析学习—使用Pandas进行数据分析

pandas进行数据分析

利用pandas进行数据分析

使用Python和Pandas进行数据分析

Python数据分析实战（2）使用Pandas进行数据分析

使用NumPy进行数据分析

使用Python进行数据分析

pandas-利用python进行数据分析

利用Python进行数据分析——pandas入门

利用Python进行数据分析——Pandas

用pandas进行数据分析实战

利用Python进行数据分析之pandas

利用pandas对初创公司进行数据分析

【利用python进行数据分析】pandas入门

用 Python 进行数据分析 pandas (一)

利用Python进行数据分析--Pandas(1)

《利用Python进行数据分析》---pandas入门

利用Python进行数据分析-Pandas

《利用Python进行数据分析》---pandas入门2

Python中的pandas模块进行数据分析

利用python进行数据分析—五、pandas入门

使用pandas进行数据分析-pandas库介绍之DataFrame基本操作

python 数据分析基础 day18－使用pandas进行数据清洗以及探索

使用Python进行数据分析——方差分析

Pandas使用DataFrame进行数据分析比赛进阶之路（一）

《使用pandas进行数据分析》网课笔记（7到12）

《使用pandas进行数据分析》网课笔记（1到6）

《使用pandas进行数据分析》网课笔记（19到23）

《使用pandas进行数据分析》网课笔记（13到18）

使用pandas，numpy进行数据分析建模的一些常用命令

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)