使用panda了解数据集信息 - 代码天地

使用panda了解数据集信息

其他 2020-06-22 19:31:30 阅读次数: 0

htxx = pd.read_sql()

--------------阅览表格--------------

查看数据前几行(对表有一个大概的认知）默认前5，参数代表前几行

htxx.head()

查看数据后几行，默认后5，参数代表后几行

htxx.tail()

查看有几行几列

htxx.shape

扫描二维码关注公众号，回复： 11345022 查看本文章

--------------查看字段类型--------------

查看数据字段的大概情况，包括类型，列字段格式，名称，占用内存等

htxx.info()

查看某一列的数据类型

htxx.ht_price.dtype

--------------重复值--------------

查看唯一值的长度是否等于数据长度，如果大于说明有重复的数据，可用drop_duplicates()删除

len(htxx.ht_no.unique())

去除重复值，keep=first代表只保留第一个，如果是last则保留最后一个

drop_duplicates = htxx.drop_duplicates(subset='ht_no',keep='first')

--------------描述统计--------------

对列中数据进行计数（统计非0元素）

htxx.kh_name.value_counts()

针对表中的数值型数据进行描述统计。一般分类数据用value_counts，数值数据用describe，这是最常用的两个统计函数。

htxx.describe()

--------------排序--------------

对单列数据进行排列，by是排序的列或行，ascending是升序，True则降序，inplace表示排序后是否更新原数据

htxx.sort_values(by = 'ht_price',axis=0,ascending = False,inplace=False,ignore_index=True)

对多列数据进行排列，部分参数使用list

htxx.sort_values(by = ['ht_price','ht_no'],axis=0,ascending = [False,True],inplace=False,ignore_index=True)

持续更新...

猜你喜欢

转载自www.cnblogs.com/xiaoqingSister/p/13178534.html

使用panda了解数据集信息

了解数据仓库

了解数据定义文件

了解数据库

了解数据结构

了解数据绑定 - Data Binding Library

简单了解数据库

了解数据存储mysql对测试的助益

初步了解数据库

了解数据库和表

JavaScript初探二（了解数据）

轻松了解数据库

一文了解数据标注

简单了解数据库事务

重新了解数据库——DML

重新了解数据库——索引

重新了解数据库——事务

简单了解数据压缩

了解数据结构中的图

你了解数据同步吗？

了解数据库与使用mysql工具——原书1.2.3章

机器阅读理解数据集

猜解数据库(MYSQL)信息

IT 数据库设计：足迹第十四步了解数据库3范式（如何使用Navicat）

Android day_06 （ListView的入门使用了解数据适配Adapter以及打气筒的使用）

数据的秘密1——了解数据与算法的含义

pandas数据分析（一）------了解数据

了解数据的发展历程--大数据简史

pandas数据分析（二）开始了解数据

初步了解数据库的并发控制

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)