【数据可视化】Plotly Express绘图库使用

Plotly Express是一个基于Plotly库的高级Python可视化库。它旨在使绘图变得简单且直观，无需繁琐的设置和配置。通过使用Plotly Express，您可以使用少量的代码创建具有丰富交互性和专业外观的各种图表。以下是Plotly Express的一些主要特点和优势：

简单易用：Plotly Express提供了一组直观的函数和方法，使得创建各种类型的图表变得非常简单。您可以使用少量的代码生成复杂的图表，而无需深入了解底层的绘图细节。
支持多种图表类型：Plotly Express支持多种常见的图表类型，包括散点图、线图、柱状图、饼图、箱线图、等高线图、地图等。您可以根据需要选择合适的图表类型来呈现数据。
内置交互性：通过使用Plotly Express，您可以轻松地为生成的图表添加交互功能。您可以缩放、平移、选择数据点、查看工具提示等，以便更好地探索数据和图表。
自动美化：Plotly Express会自动为生成的图表添加专业的样式和外观。这意味着您不需要手动进行大量的配置和调整，即可获得漂亮的图表。当然，您也可以通过一些参数来自定义图表的外观。
整合Plotly图表生态系统：Plotly Express是Plotly图表生态系统的一部分，可以与其他Plotly库和工具进行无缝集成。您可以将Plotly Express与Plotly的其他组件（如Dash）一起使用，构建交互性强大的数据可视化应用程序。

Plotly Express与matplotlib和pyecharts相比有以下几个优势：

交互性：Plotly Express内置了交互性，使用户能够在图表中进行缩放、平移、选择数据点以及查看工具提示等操作。这种交互性使得数据的探索和分析变得更加直观和灵活。而matplotlib和pyecharts在交互性方面相对有限。
美观性：Plotly Express提供了一组精心设计的默认样式，使得生成的图表外观美观并具有专业感。您可以获得漂亮的图表，而无需过多的配置和调整。相比之下，matplotlib需要更多的手动配置来实现类似的外观，而pyecharts则提供了一些模板和预设主题，但美观性较Plotly Express稍逊一筹。
多种图表类型：Plotly Express支持多种常见的图表类型，包括散点图、线图、柱状图、饼图、箱线图、等高线图、地图等。这使得用户可以根据需要选择最适合的图表类型来呈现数据。matplotlib也提供了多种图表类型，但在某些类型的图表上，Plotly Express的绘制和配置更为简单和直观。
Pythonic接口：Plotly Express的API设计符合Pythonic风格，使用起来更加直观和易于理解。它提供了一组简洁的函数和方法，使用户能够以一种自然的方式生成图表。相比之下，matplotlib的API较为繁琐，需要更多的代码来实现相同的效果，而pyecharts则使用了类似于JavaScript的配置方式。
与Plotly生态系统的集成：Plotly Express是Plotly图表生态系统的一部分，与其他Plotly库和工具无缝集成。这意味着您可以将Plotly Express与其他Plotly组件（如Dash）一起使用，构建交互性强大的数据可视化应用程序。这种集成性使得Plotly Express成为一个功能丰富且灵活的选择。

import pandas as pd
import plotly_express as px

gapminder = pd.DataFrame(px.data.gapminder())
gapminder.rename(columns={"year": "年份", "country": "国家", "continent": "所在洲",
                          "lifeExp": "预期寿命", "pop": "人口", "gdpPercap": "人均GDP",
                          "iso_alpha": "ISO国家代码", "iso_num": "ISO数字代码"}, inplace=True)
gapminder['所在洲'] = gapminder["所在洲"].map({"Asia": "亚洲", "Europe": "欧洲",
                                         "Africa": "非洲", "Americas": "美洲", "Oceania": "大洋洲"})
# line 图
fig = px.line(
    gapminder,  # 数据集
    x="年份",  # 横坐标
    y="预期寿命",  # 纵坐标
    color="所在洲",  # 颜色的数据
    line_group="所在洲",  # 线性分组
    hover_name="国家",  # 悬停hover的数据
    line_shape="spline",  # 线的形状
    render_mode="svg"  # 生成的图片模式
)
fig.show()

# area 图
fig = px.area(
    gapminder,  # 数据集
    x="年份",  # 横坐标
    y="人口",  # 纵坐标
    color="所在洲",  # 颜色
    line_group="国家"  # 线性组别
)
fig.show()

fig = px.scatter(
    gapminder  # 绘图DataFrame数据集
    , x="人均GDP"  # 横坐标
    , y="预期寿命"  # 纵坐标
    , color="所在洲"  # 区分颜色
    , size="人口"  # 区分圆的大小
    , size_max=60  # 散点大小
)
fig.show()

fig = px.scatter(
    gapminder  # 绘图使用的数据
    , x="人均GDP"  # 横纵坐标使用的数据
    , y="预期寿命"  # 纵坐标数据
    , color="所在洲"  # 区分颜色的属性
    , size="人口"  # 区分圆的大小
    , size_max=60  # 圆的最大值
    , hover_name="国家"  # 图中可视化最上面的名字
    , animation_frame="年份"  # 横轴滚动栏的属性year
    , animation_group="国家"  # 标注的分组
    , facet_col="所在洲"  # 按照国家country属性进行分格显示
    , log_x=True  # 横坐标表取对数
    , range_x=[100, 100000]  # 横轴取值范围
    , range_y=[25, 90]  # 纵轴范围
    , labels=dict(pop="人口",  # 属性名字的变化，更直观
                  gdpPercap="人均GDP",
                  lifeExp="预期寿命")
)
fig.show()

fig = px.choropleth(
    gapminder,  # 数据集
    locations="ISO国家代码",  # 配合颜色color显示
    color="预期寿命",  # 颜色的字段选择
    hover_name="国家",  # 悬停字段名字
    animation_frame="年份",  # 注释
    color_continuous_scale=px.colors.sequential.Plasma,  # 颜色变化
    projection="natural earth"  # 全球地图
)
fig.show()

fig = px.scatter_geo(
    gapminder,  # 数据
    locations="ISO国家代码",  # 配合颜色color显示
    color="所在洲",  # 颜色
    hover_name="国家",  # 悬停数据
    size="人口",  # 大小
    animation_frame="年份",  # 数据帧的选择
    projection="natural earth"  # 全球地图
)
fig.show()

fig = px.line_geo(
    gapminder,  # 数据集
    locations="ISO国家代码",  # 配合和color显示数据
    color="所在洲",  # 颜色
    projection="orthographic")  # 球形的地图
fig.show()

iris = pd.DataFrame(px.data.iris())
iris.rename(columns={"sepal_width": "花萼宽度", "sepal_length": "花萼长度", "petal_width": "花瓣宽度",
                     "petal_length": "花瓣长度", "species": "品种", "species_id": "品种编号"}, inplace=True)
iris['品种'] = iris["品种"].map({"setosa": "山鸢尾", "versicolor": "变色鸢尾",
                                         "virginica": "维吉尼亚鸢尾"})

fig = px.scatter(
    iris,  # 数据集
    x="花萼宽度",  # 横坐标
    y="花萼长度"  # 纵坐标
)
fig.show()

fig = px.scatter(
    iris,  # 数据集
    x="花萼宽度",  # 横坐标
    y="花萼长度",  # 纵坐标
    color="品种",  # 颜色
    marginal_x="histogram",  # 横坐标直方图
    marginal_y="rug"  # 细条图
)
fig.show()

fig = px.scatter(
    iris,  # 数据集
    x="花萼宽度",  # 横坐标
    y="花萼长度",  # 纵坐标
    color="品种",  # 颜色
    marginal_y="violin",  # 纵坐标小提琴图
    marginal_x="box",  # 横坐标箱型图
    trendline="ols"  # 趋势线
)
fig.show()

fig = px.scatter_matrix(
    iris,  # 数据
    dimensions=["花萼宽度", "花萼长度", "花瓣宽度", "花瓣长度"],  # 维度选择
    color="品种")  # 颜色
fig.show()

fig = px.parallel_coordinates(
    iris,  # 数据集
    color="品种编号",  # 颜色
    labels={"品种编号": "品种",  # 各种标签值
            "花萼宽度": "花萼宽度",
            "花萼长度": "花萼长度",
            "花瓣长度": "花瓣长度",
            "花瓣宽度": "花瓣宽度"},
    color_continuous_scale=px.colors.diverging.Tealrose,
    color_continuous_midpoint=2)
fig.show()

fig = px.density_contour(
    iris,  # 数据集
    x="花萼宽度",  # 横坐标值
    y="花萼长度",  # 纵坐标值
    color="品种",  # 颜色
    marginal_x="rug",  # 横轴为线条图
    marginal_y="histogram"  # 纵轴为直方图
)
fig.show()


wind = pd.DataFrame(px.data.wind())
wind.rename(columns={"frequency": "频率", "direction": "方向", "strength": "强度"}, inplace=True)
fig = px.bar_polar(
    wind,   # 数据集
    r="频率",   # 半径
    theta="方向",  # 角度
    color="强度",  # 颜色
    template="plotly_dark",  # 主题
    color_discrete_sequence=px.colors.sequential.Plasma_r)  # 颜色变化
fig.show()

【数据可视化】Plotly Express绘图库使用

猜你喜欢