跟艾文学编程《零基础入门学Python》(01)基于Plotly的动态可视化绘图

作者:艾文,计算机硕士学位,企业内训讲师和金牌面试官,公司资深算法专家,现就职BAT一线大厂。
邮箱:[email protected]
博客:https://wenjie.blog.csdn.net/
内容:跟艾文学编程《零基础入门学Python》

目标

  • plotly基础概念介绍
  • plotly绘图控件介绍
  • plotly安装
  • 绘制一个plotly图可视化
  • 可视化图表(直方图,柱状图,散点图,饼状图,热力图,时序图,箱线图等)

内容

  • 介绍¶

以Python为基础进行数据分析,Matplotlib存在不够美观、静态性、不易分享等缺点,限制了Python在数据可视化中的发展。为了解决这个问题,新型的动态可视化开源模块Plotly应运而生。由于Plotly具有动态、美观、易用、种类丰富等特性。项目案例包括泰坦尼克号数据、鸢尾花数据、航班数据、金融类数据进行可视化图表分析,可以快速让大家如何掌握项目中的数据分析如何处理。

项目实战内容:泰坦尼克号数据、鸢尾花数据、航班数据、金融类数据

  • 要求

无论你是零基础的人员还是有一定的Python 基础的学员,都可以通过该课程进行学习。本课程重点以实战教程为基础,让你快速掌握Python 工具的 使用和如何通过jupyter-notebook 进行数据分析,真对业务理解可以通过交互试图表plotly 进行分析。 这些课程尤其对于AI 产品经理也很有帮助,可以本课程,可以让你在公司数据分析中可以更快、效率 更高、工作收获最大。

  • 受益

快速掌握Plotly库的使用方法,熟练绘制各种数据分析中常用图表

掌握python数据分析的方法

plotly介绍

python绘图:matplotlib,seaborn,plotly

数据分析的一个业务场景就是用数据讲故事,交互信息可视化的工具就在此凸显出了优势。

Python可视化的库还有很多,熟练掌握matplotlib和seaborn,针对具体业务用好plotly足以从容面对大多数的数据分析场景。

Plotly是一个非常著名且强大的开源数据可视化框架,它通过构建基于浏览器显示的web形式的可交互图表来展示信息,可创建多达数十种精美的图表和地图,

下面我们以jupyter notebook为开发工具数据分析。Matplotlib存在不够美观、静态性、不易分享等缺点,限制了Python在数据可视化中的发展。为了解决这个问题,新型的动态可视化开源模块Plotly应运而生。

由于Plotly具有动态、美观、易用、种类丰富等特性。

可以说,plotly 在Python 绘制图表的时候,是一种顶层的绘制方式。

我们首先通过plotly官方网站看看数据可视化效果图,这里截取了一部分的效果,发现真是无比强大,并且还支持数据/图片在线编辑。

plotly绘图控件

基本图表:20种

统计和海运方式图:12种

科学图表:21种

财务图表:2种

地图:8种

3D图表:19种

报告生成:4种

连接数据库:7种

拟合工具:3种

流动图表:4种

JavaScript添加自定义控件:13种

plotly 安装

pip install plotly

完成ploytly 安装程秀后,我们需要检查是否安装,通过下面操作下进行

第一个plotly 图可视化

  • 导入相关包

  • 第一个绘制图形

显示结果如下

可视化图表数据案例

本课程所有的项目案例的数据包括: 泰坦尼克号的数据、iris 数据、航班数据、金融累的数据,通过这些数据分析,可以 快速的让大家掌握项目中plotly 进行数据绘图分析。

  • 加载数据

  • 查看4类数据(默认5条)

这里flights 通过pivot 函数处理

金融类数据展示

项目案例1: 泰塔尼克号 直方图

在分析一组数据的时候,看的就是变量的分布规律,而直方图提供这样非常简单的功能。

通过观察数据,对age进行直方图的展示,实际age 数据存在missing,先用dropna函数删除missing 的数据,否则无法绘制 出图形。

项目案例2: 泰塔尼克号 柱状图

这里我们统计每类仓位等级 对应的幸存下来的人数数据分析

项目案例3: 泰塔尼克号 分组柱状图

我们x轴 仓位等级class,我们将sex 在进行细化,完成分组柱状图的效果

项目案例4: iris 散点图

散点图: 主要用于分析数据的集中程度。

项目案例5: 航班数据 折线图

主要分析数据的一些变化趋势,我们这里分析航班的数据,主要查看每年每月乘客数的一些变化

上面的操作非常的麻烦,定义一个函数封装每年的数据,然后就可以把所有的数据都显示出来

项目案例6: 泰塔尼克号 饼状图

通过饼状图,主要用于分析不同类别数据占比情况

分析 不同的embarked 人员的幸存人数占比

项目案例7: 泰塔尼克号 箱线图

是一种作用与数据分析是否异常点数据或者离群点,它能显示一组数据的最大数值,最小数值,中位数以及上下四分位数据。 都可以通过 这种图表观察到这种数据

我们统计不同仓位级别的年龄分布情况

我们可以对我们上述的代码进一步优化调整,使得我们的代码更加容易查看,代码量比较少

项目案例8:航班数据 热力图

通常用来表示特征之间的相关性,一般通过颜色的深浅来表示数值的大小或者相关性的高低

我们先通过一个简单的数据示例来观察如何生成一个热力图,重点构建 x,y,z 三个变量的数据

接下来我们通过pandas 加载我们一个航班的数据,每年每月的乘客数,这就一个热力图的实际应用

我们构建热力图 所需要的是三个维度的数据信息

x: 月份标签

y: 年份标签

z: 年份和月份对应的乘客数

项目案例9:金融数据 时序图

我们可以通过时序图每个时间点数据变化,例如: 在金融领域,可以通过该方法用于分析每天的股价的变化趋势

统计下金融数据每天的股价的变化趋势

接下来,我们在进一步功能优化

更多内容学习,请关注,多评论多支持,让我们一起加油。

猜你喜欢

转载自blog.csdn.net/shenfuli/article/details/127958762
今日推荐