最简单方法!!用python生成动态条形图(解决报错问题!)

最简单方法!!用python生成动态条形图

最近非常流行动态条形图,在B站等视频网站上,此类视频经常会有上百万的播放量,今天我们通过第三方库:bar_chart_race (0.2 版本)来实现动态条形图的生成;生成的效果如图:
问题:我发现按照目前流行的文章里操作,会有很多的报错,有一些我解决了,有一些我还没有解决,现在把目前的进展记录在这里;数据与程序在这里:点击下载

在这里插入图片描述

1. 安装第三方包: bar_chart_race

首先,我们要明白:只有 0.2版本才支持动态条形图,所以我们必须保证我们安装的第三方库为 0.2版本;
遗憾的是,我们通过pip install bar_chart_race 命令安装的第三方包,版本是0.1,也无法升级;所以,这里我们推荐在github上下载,然后安装;安装步骤如下:

  1. 首先要保证已经安装了github 软件,如果没有,windows 请在这里下载:https://git-scm.com/download/win, 点击自己的版本下载,然后安装;其他系统也是一样滴~~
    在这里插入图片描述

  2. git安装完毕后,在cmd中切换到想要下载的目录,然后下载:git clone https://github.com/dexplo/bar_chart_race.git
    其中,https://github.com/dexplo/bar_chart_race.git 就是它的git地址;
    我这里下载的目录是:D:\PY_useful\3_python 基础,下载完成后,会生成一个文件夹:bar_chart_race
    在这里插入图片描述

  3. 在cmd中进入该文件夹,然后运行:python setup.py install,安装完成后,会提示:Finished processing dependencies for bar-chart-race==0.2.0 ,看到这个,就证明我们成功了!
    在这里插入图片描述

2. 数据准备

数据需要满足以下条件:

  1. 每一行必须是一个单独日期的数据;
  2. 每一列是一个单独的分类;
  3. 索引最好是日期数据(可选项);
  4. 数据必须变化成 pandas.DataFrame 格式;

官网 https://www.dexplo.org/bar_chart_race/, 官网的举例如下:

date Belgium China France Germany Iran Italy Netherlands Spain USA United Kingdom
2020-04-08 2240 3337 10887 2349 3993 17669 2255 14792 14704 7111
2020-04-09 2523 3339 12228 2607 4110 18279 2403 15447 16553 7993
2020-04-10 3019 3340 13215 2767 4232 18849 2520 16081 18595 8974
2020-04-11 3346 3343 13851 2894 4357 19468 2653 16606 20471 9892
2020-04-12 3600 3343 14412 3022 4474 19899 2747 17209 22032 10629

但是,由于官网上的例子都是使用 df = bcr.load_dataset('covid19_tutorial') 加载的,而我们如果不翻墙的话,是无法加载这个数据的,我把供大家练习的数据放在这里:点击下载练习数据

3. 函数讲解

第三方模块bar_chart_race,只有两个函数来生成我们的动态图,

  1. 动态条形图:bar_chart_race.bar_chart_race();下面详细解释一下这个函数中所有的参数:
  2. 动态线形图:bar_chart_race.line_chart_race();与上面的条形图类似;
import bar_chart_race as bcr
import pandas
df=pd.read_csv('数据.csv',index_col=0)   # 下载数据后,放在.py文件所在文件夹;

# 以下有 # 注释的参数,是我实际使用中发现并没有的;可是官网资料上有这些参数,不知道为什么~~
bcr.bar_chart_race(
    df=df,    # 第一个参数就是数据,这个数据格式必须是 pandas.DataFrame 格式,同时满足数据准备中所说的条件;
    filename='bar_chart.mp4',   # 这个参数是生成文件的名字,一般为.mp4 & .gif;
    orientation='h',    # 方向
    sort='desc', # 排序
    n_bars=6, # 限制条形图数量
    fixed_order=False,  # 固定标签
    fixed_max=True, # 固定轴的最大值
    steps_per_period=10,   # 帧数设置
    interpolate_period=False,  # 插入时间
    # label_bars=True,   # 是否有label
    bar_size=.95,   # 设置bar宽度 取值 0~1 之间;
    period_label={
    
    'x': .99, 'y': .25, 'ha': 'right', 'va': 'center'},
    # period_fmt='%B %d, %Y',  # 日期的格式设置
    period_summary_func=lambda v, r: {
    
    'x': .99, 'y': .18,
                                      's': r'Total weigth: {v.sum():,.0f}',
                                      'ha': 'right', 'size': 8, 'family': 'Courier New'},
    perpendicular_bar_func='median',
    period_length=500,
    # figsize=(5, 3),
    # dpi=144,
    # cmap='dark12',
    title='COVID-19 Deaths by Country',
    # title_size='',
    # bar_label_size=7,
    # tick_label_size=7,
    shared_fontdict={
    
    'family' : 'DejaVu Sans', 'color' : '.1'},
    scale='linear',
    writer=None,
    fig=None,
    bar_kwargs={
    
    'alpha': .7},
    filter_column_colors=False) 

4. 详细举例(复制即可用)

4.1 基本条形图

import bar_chart_race as bcr
import pandas as pd

df=pd.read_csv('数据.csv',index_col=0)
bcr.bar_chart_race(df,filename='动态条形图.mp4')

效果如图:
在这里插入图片描述

4.2 柱状图

使用 orientation 参数,转换图的方向;这里 orientation 有两个可赋予的值 hv

import bar_chart_race as bcr
import pandas as pd

df=pd.read_csv('数据.csv',index_col=0)
bcr.bar_chart_race(df,'动态柱状图.mp4',orientation='v')

效果如图:
在这里插入图片描述

4.3 排序图

默认情况下,是按照降序排列的,当我们需要升序排列时,使用参数:sort='asc'

import bar_chart_race as bcr
import pandas as pd

df=pd.read_csv('数据.csv',index_col=0)
bcr.bar_chart_race(df,'动态柱状图_升序.mp4',sort='asc')

效果如图:
在这里插入图片描述

4.4 限制条形图数量

默认情况下,所有的列都会被显示;如果我们需要控制数量,使用参数:n_bars=6,这里数字6,可以改成任意整数;

import bar_chart_race as bcr
import pandas as pd

df=pd.read_csv('数据.csv',index_col=0)
bcr.bar_chart_race(df,'动态柱状图_5条形图.mp4',n_bars=5)

效果如图:
在这里插入图片描述

4.5 固定条形的顺序

默认情况下,条形图会被按照降序排列,如果我们想固定顺序,使用参数:fixed_order,将其改为True 或者 赋值一个列表;

import bar_chart_race as bcr
import pandas as pd

df=pd.read_csv('数据.csv',index_col=0)
bcr.bar_chart_race(df,'动态柱状图_条形固定.mp4',fixed_order=['Apple', 'banana', 'watermelon', 'orange'])

效果如图:
在这里插入图片描述

4.6 固定轴的最大值

默认情况下,数值轴的最大值根据时间变换,如果想要固定,使用参数:fixed_max=True

import bar_chart_race as bcr
import pandas as pd

df=pd.read_csv('数据.csv',index_col=0)
bcr.bar_chart_race(df,'动态条形图_固定轴的最大值.mp4',fixed_max=True)

效果如图:
在这里插入图片描述

4.7 设置帧数

默认情况下,帧数为10,我们可以将这个值改大,使图像更流畅;当然也可以改小;

import bar_chart_race as bcr
import pandas as pd

df=pd.read_csv('数据.csv',index_col=0)
bcr.bar_chart_race(df,'动态条形图_设置帧数.mp4',steps_per_period=24)

效果如图:
在这里插入图片描述

4.8 设置步长与停留时间

import bar_chart_race as bcr
import pandas as pd

df=pd.read_csv('数据.csv',index_col=0)
bcr.bar_chart_race(df,'动态条形图_设置步长与停留时间.mp4',steps_per_period=20, period_length=200)

效果如图:
在这里插入图片描述

4.9 添加插入时间

import bar_chart_race as bcr
import pandas as pd

df=pd.read_csv('数据.csv',index_col=0)
bcr.bar_chart_race(df,'动态条形图_插入时间.mp4',interpolate_period=True)

4.10 设置字体属性

import bar_chart_race as bcr
import pandas as pd

df=pd.read_csv('数据.csv',index_col=0)
bcr.bar_chart_race(df,filename='动态条形图_设置字体属性.mp4',shared_fontdict={
    
    'family': 'Helvetica', 'weight': 'bold','color': 'rebeccapurple'})

效果如图:
在这里插入图片描述

4.11 定制条形属性

import bar_chart_race as bcr
import pandas as pd

df=pd.read_csv('数据.csv',index_col=0)
bcr.bar_chart_race(df,filename='动态条形图_定制条形属性.mp4',bar_kwargs={
    
    'alpha': .2, 'ec': 'black', 'lw': 3})

效果如图:
在这里插入图片描述

4.12 增加文本说明

这个,目前还没有研究成功,稍后更新~

4.13 增加垂直bar平均值

import bar_chart_race as bcr
import pandas as pd

df=pd.read_csv('数据.csv',index_col=0)
bcr.bar_chart_race(df,filename='动态条形图_增加垂直bar平均值.mp4',perpendicular_bar_func='mean')

效果如图:
在这里插入图片描述

4.14 自定义垂直bar——最大值

import bar_chart_race as bcr
import pandas as pd

df=pd.read_csv('数据.csv',index_col=0)
# 自定义增加垂直bar
def func(values, ranks):
    return values.max()
bcr.bar_chart_race(df,filename='动态条形图_增加垂直bar自定义最大值.mp4', perpendicular_bar_func=func)

效果如图:
在这里插入图片描述

4.15 条形图颜色不重复

import bar_chart_race as bcr
import pandas as pd

df=pd.read_csv('数据.csv',index_col=0)
bcr.bar_chart_race(df,filename='动态条形图_条形图颜色不重复.mp4',filter_column_colors=True)

效果如图:
在这里插入图片描述

5. 遇到的问题

5.1 [报错] AttributeError: module ‘sip‘ has no attribute ‘setapi‘

问题描述: 导入 import bar_chart_race 报错
最近在导入bar_chart_race 包时,遇到报错:AttributeError: module ‘sip’ has no attribute ‘setapi’
导入的包:

import bar_chart_race as bcr

只是运行导入的语句,就会报错:AttributeError: module ‘sip’ has no attribute ‘setapi’

解决办法:
最后发现这个报错的原因是 matplotlib 库的版本太高,我报错的版本是 3.3.2,将其降级到 3.3.0 就没有问题了;

先卸载:pip uninstall matplotlib

再安装:pip install matplotlib==3.3.0

问题解决!!

5.2 [报错] IndexError: list index out of range

问题描述: 当输出时.gif 格式时(如果是.mp4格式,不会报错),运行时报错:IndexError: list index out of range

解决办法: 下载 :https://imagemagick.org/script/download.php 处的软件,安装即可,但是这个网址下载比较慢,也可以点击这里下载(点击下载); 下载安装,记得在安装时要勾选这两项;
在这里插入图片描述
安装完成后,问题解决!!

5.3 [报错] TypeError: bar_chart_race() got an unexpected keyword argument 'figsize'

问题描述: 按照官网的实例进行配置时,发现有一些参数在实际的函数中是没有的,列举如下:

    label_bars=True,   # 是否有label
    period_fmt='%B %d, %Y',  # 日期的格式设置
    figsize=(5, 3),
    dpi=144,
    cmap='dark12',
    title_size='',
    bar_label_size=7,
    tick_label_size=7,

上面列举的这些参数,在函数中都不包含,我也不知道为什么~ 因为有关这个第三方包的文章,大家都是翻译的官网的例子,并没有人实际求证,所以这个问题,如果大家有知道原因的~ 欢迎大家告诉我呀~ 感谢!!

猜你喜欢

转载自blog.csdn.net/weixin_47139649/article/details/109116992
今日推荐