Python大数据之pandas快速入门(一) - 代码天地

Python大数据之pandas快速入门(一)

业界资讯 2023-09-29 20:54:26 阅读次数: 0

文章目录

pandas快速入门

pandas快速入门

学习目标

能够知道 DataFrame 和 Series 数据结构
能够加载 csv 和 tsv 数据集
能够区分 DataFrame 的行列标签和行列位置编号
能够获取 DataFrame 指定行列的数据

1. DataFrame 和 Series 简介

pandas是用于数据分析的开源Python库，可以实现数据加载，清洗，转换，统计处理，可视化等功能。

pandas最基本的两种数据结构：

1）DataFrame

用来处理结构化数据（SQL数据表，Excel表格）
可以简单理解为一张数据表(带有行标签和列标签)

2）Series

用来处理单列数据，也可以以把DataFrame看作由Series对象组成的字典或集合
可以简单理解为数据表的一行或一列

2. 加载数据集(csv和tsv)

2.1 csv和tsv文件格式简介

csv 和 tsv 文件都是存储一个二维表数据的文件类型。

注意：其中csv文件每一列的列元素之间以逗号进行分割，tsv文件每一行的列元素之间以\t进行分割。

2.2 加载数据集(tsv和csv)

1）首先打开jupyter notebook，进入自己准备编写代码目录下方，创建01-pandas快速入门.ipynb文件：

注意：提前将提供的 data 数据集目录放置到 01-pandas快速入门.ipynb 同级目录下，后续课程会加载 data 目录下的数据集。

2）导入 pandas 包

注意：pandas 并不是 Python 标准库，所以先导入pandas

# 在 ipynb 文件中导入 pandas
import pandas as pd

3）加载 csv 文件数据集

tips = pd.read_csv('./data/tips.csv')
tips

4）加载 tsv 文件数据集

# sep参数指定tsv文件的列元素分隔符为\t，默认sep参数是,
china = pd.read_csv('./data/china.tsv', sep='\t')
china

猜你喜欢

转载自blog.csdn.net/xianyu120/article/details/133300011

Python大数据之pandas快速入门(一)

Python大数据之pandas快速入门(二)

python---之pandas大数据读写

Python pandas快速入门

零基础入门到精通：Python大数据与机器学习之Pandas-数据操作

Python数据分析之Pandas（1）——Pandas官方文档解读：一篇文章 Pandas 快速上手

大数据学习之Hadoop快速入门

[大数据之Spark]——快速入门

大数据技术之Hadoop快速入门

大数据之Kafka：Kafka快速入门

Python数据分析之pandas入门

快速入门大数据

Python3快速入门（十三）——Pandas数据结构

Python3快速入门（十五）——Pandas数据处理

【python数据处理】pandas快速入门集合

大数据技术之Kafka（一）Kafka概述、Kafka快速入门、Kafka架构深入

大数据技术之HBase（一）HBase简介、HBase快速入门、HBase进阶

大数据技术之Flume（一）Flume概述、Flume快速入门

python数据分析之pandas（一）

Python之Pandas超详细入门教程 -- 第一章 Pandas数据结构【基础篇】

数据分析入门之python pandas数据导入与导出

大数据Hadoop学习之快速入门方法

大数据技术分享之快速入门Scala篇

【Pandas】快速入门pandas

大数据ZooKeeper快速入门

大数据Hadoop快速入门

【大数据】Hadoop快速入门

【大数据】ZooKeeper快速入门

python之pandas入门操作

python3 科学计算之pandas入门(一)

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)