Numpy学习疑难杂录——读《python数据分析》 - 代码天地

Numpy学习疑难杂录——读《python数据分析》

其他 2019-01-07 15:55:48 阅读次数: 0

Numpy.loadtxt函数的使用

从函数名的字面意义上理解，该函数用于从文本文件中载入数据到numpy数组。
参照书籍《Python Data Analysis》(中译名：《python 数据分析》)中3.2节的示例，意图对csv文件进行数据导入时出现错误。

data = np.loadtxt("hjy.csv",delimiter=',',skiprows=2,unpack=True)

产生该错误的原因是loadtxt函数的参数中的dtype参数默认为float，而当被处理的csv文件范围中存在‘空值’、‘字符串’时，便会
出现这个异常，因此确认单元格中的值类型是很重要的，如果你用notepad++文件打开，你就会发现你所需要处理的数据里，
数值和字符串是混着的，那么出现异常也就能理解了。

因此我们需要做一些预处理：

对于不必要的表头，使用skiprows参数跳过不处理，即使它们是字符串也不会产生影响；
对于字符串的列，使用usecols参数指定要处理的列，这样也可以避免处理字符串列；
对于数据值的域，使用查找替换将所有的空值替换成0

对于数据类型的定义，有时根据需要的值类型、值范围，自己指定会更合适，使用参数dtype

因此对于如下数据表：

使用如下语句避开字符串行列的干扰：

data = np.loadtxt("hjy.csv",dtype=np.int16,delimiter=',',
                  skiprows=2,usecols=(2,),unpack=True)

其中usecols可以这样赋值：

usecols=(x for x in range(1,6))

猜你喜欢

转载自blog.csdn.net/yeshankuangrenaaaaa/article/details/83751343

Numpy学习疑难杂录——读《python数据分析》

学习数据分析之python的numpy

python数据分析的numpy学习笔记

Python数据分析之numpy学习

python数据分析numpy库学习

python数据分析-NumPy学习

（转载）学习numpy Python数据分析之numpy学习

Python数据分析-Numpy

Python数据分析：Numpy

数据分析-----------numpy 学习

数据矿工学习-Python数据分析之numpy

(转)Python数据分析之numpy学习

python数据分析之numpy学习二

python数据分析之numpy学习一

《Python数据分析与展示》-Numpy学习笔记02

《Python数据分析与展示》-Numpy学习笔记01

「机器学习」Python数据分析之Numpy

python数据分析学习笔记-Numpy-Matplotlib-Pandas

「机器学习」Python数据分析之Numpy进阶

Python数据分析与机器学习-NumPy_5

python机器学习与数据分析实战笔记——numpy基础

Python数据分析库：Numpy和Matplotlib的学习笔记

Python数据分析学习（一）_Numpy_数组

大数据分析学习：Python数据分析之numpy

Python数据分析--------numpy数据打乱

【Python 数据分析】Numpy模块

python数据分析——numpy基础（四）

python数据分析——pandas，numpy，matplot

python-Numpy数据分析（二）

python-Numpy数据分析（一）

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)