数据分析之NumPy（七）IO操作与数据处理 - 代码天地

数据分析之NumPy（七）IO操作与数据处理

其他 2019-03-20 19:27:19 阅读次数: 0

版权声明：版权声明：笔者博客文章主要用来作为学习笔记使用，内容大部分来自于自互联网，并加以归档整理或修改，以方便学习查询使用，只有少许原创，如有侵权，请联系博主删除！ https://blog.csdn.net/qq_42642945/article/details/88396926

问题

大多数数据并不是我们自己构造的，而是存在文件当中，需要我们用工具获取。
但是Numpy其实并不适合用来读取和处理数据，因此我们这里了解相关API，以及Numpy不方便的地方即可。

Numpy读取

genfromtxt(fname[, dtype, comments, …]) Load data from a text file, with missing values handled as specified.
准备数据test.csv：

# 读取数据
test = np.genfromtxt("test.csv", delimiter=',')

返回结果：

array([[  nan,   nan,   nan,   nan],
       [  1. , 123. ,   1.4,  23. ],
       [  2. , 110. ,   nan,  18. ],
       [  3. ,   nan,   2.1,  19. ]])

如何处理缺失值

1 什么是缺失值

什么时候numpy中会出现nan：当我们读取本地的文件为float的时候，如果有缺失(或者为None)，就会出现nan

2 缺失值处理

那么，在一组数据中单纯的把nan替换为0，合适么？会带来什么样的影响？

比如，全部替换为0后，替换之前的平均值如果大于0，替换之后的均值肯定会变小，所以更一般的方式是把缺失的数值替换为均值（中值）或者是直接删除有缺失值的一行
所以：

如何计算一组数据的中值或者是均值
如何删除有缺失数据的那一行（列）在pandas中介绍

t中存在nan值，如何操作把其中的nan填充为每一列的均值
t = array([[ 0., 1., 2., 3., 4., 5.],
[ 6., 7., nan, 9., 10., 11.],
[ 12., 13., 14., nan, 16., 17.],
[ 18., 19., 20., 21., 22., 23.]])
处理逻辑：
在这里插入图片描述
看了上面的处理过程，非常麻烦，别担心之后我们会介绍强大的Pandas工具进行处理！！
看了上面的处理过程，非常麻烦，别担心之后我们会介绍强大的Pandas工具进行处理！
下一部分我们将继续学习Python数据分析的另一个强大工具PANDAS

版权声明：
笔者博客文章主要用来作为学习笔记使用，内容大部分整理自互联网，如有侵权，请联系博主删除！

猜你喜欢

转载自blog.csdn.net/qq_42642945/article/details/88396926

数据分析之NumPy（七）IO操作与数据处理

数据分析之numpy基本操作

Python数据处理之（七）Numpy array 合并

数据分析之pandas常见的数据处理

Python大数据分析之数据处理

数据分析入门之python数据处理

数据分析之数据处理大纲概要

python数据分析-数据处理

数据分析(5)-数据处理

Python数据分析 | (11)利用NumPy数组进行数据处理

数据分析中Numpy,Pandas,Matplotlib,scripy和Scikit-Learn等数据处理库

数据分析实用小笔记1.1—numpy数据处理替换NAN

利用python数据分析——Numpy基础：通用函数、利用数组进行数据处理

数据分析之numpy

Numpy数据处理

数据分析之NumPy（三）基本操作

python数据处理之numpy

数据处理之NumPy，pandas

Python 数据分析三剑客之 NumPy（六）：矩阵 / 线性代数库与 IO 操作

大数据分析中，数据处理之数据归一化

数据分析:Numpy的基本操作-Python

python数据分析-numpy 矩阵操作

python数据分析-numpy数组操作

【Python 数据处理基础】数据分析师常用的日期、时间操作汇总

python 04数据分析（numpy矩阵算术、数学函数、io操作）

数据分析三剑客之数据处理（六）

数据分析 numpy

数据分析-numpy

数据分析（numpy）

数据分析(numpy)

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)