Python实现样本类别的可视化（绘制饼图，展示各类别样本的比例） - 代码天地

Python实现样本类别的可视化（绘制饼图，展示各类别样本的比例）

其他 2018-05-30 10:07:12 阅读次数: 1

在适应机器学习等模型来进行实验的时候，我们往往事先需要对原始数据样本的分布有一定的了解，初步了解我们的样本数据一共有多少类别，各个类别中样本数据的比例是否均衡，因为对于不均衡的数据比例会采用不同的模型，如：对于正负样本数据失衡的情况我们往往会采用异常点检测等方法，而不是SVM这类常规的检测模型。

下面是简单的方法，通过对样本数据类别标签的展示来可视化不同类别样本数据的占比情况：

from collections import Counter

def sample_class_show(y,savepath='res.png'):
    '''
    绘制饼图,其中y是标签列表
    '''
    target_stats=Counter(y)
    labels=list(target_stats.keys())
    sizes=list(target_stats.values())
    explode=tuple([0.1] * len(target_stats))
    fig, ax=plt.subplots()
    ax.pie(sizes, explode=explode,labels=labels, shadow=True,autopct='%1.1f%%')
    ax.axis('equal')
    plt.savefig(savepath)

简单测试如下：

实验一：

y=[0,0,1,2,0,2,2,0,0,0,0,1,1,2,2,2,0,0,2,2,2,2,2,2,2,2,1,1,1,2,2,2,2,0,0]

sample_class_show(y,savepath='label_distribution.png')

结果如下：

实验二：

y=[0,0,1,2,0,2,2,0,0,0,3,3,3,3,3,0,1,1,2,2,3,3,3,3,2,0,0,2,2,2,2,2,2,2,2,1,1,1,2,2,2,2,0,3,3,0,1,1,1,2,2,2,0,0,3,3,3]
sample_class_show(y,savepath='label_distribution2.png')

结果为：

从上面的饼图中，我们可以很直观地看出来不同类别样本数据的不同占比情况，对于后续的处理有一定的帮助。

猜你喜欢

转载自blog.csdn.net/together_cz/article/details/80001920

Python实现样本类别的可视化（绘制饼图，展示各类别样本的比例）

样本类别均衡化

Python解决数据样本类别分布不均衡问题

Caffe可视化MNIST错误识别样本

类别样本不平衡问题

python pyecharts 数据可视化饼状图绘制

python 数据可视化饼状图绘制

解决样本类别分布不均衡的问题

分类中样本类别不均衡问题及解决

Spark ML处理样本类别不均衡问题

Python借助smote实现不均衡样本数据的上采样和下采样，并可视化展示样本分布

饼状图显示各类别展示所占百分比

支持向量机SVM详解——多类别样本分类

python可视化---饼图pie()

python可视化---饼图

Python数据可视化 -- 饼图

python数据可视化——饼图

echarts 可视化数据展示饼图

Python 快速获取样本标签类别及目标个数

【可视化】pandas与matplotlib绘制环形饼图

ECharts数据可视化（绘制标准饼图）

Python爬取各类基金数据，以『动图可视化』方式展示基金的涨跌情况

学习笔记之：Python数据可视化pyecharts绘制饼图

K个最近邻的训练样本类别是预测KNN

6-机器学习-样本类别分布不均衡处理之过抽样和欠抽样

多分类样本类别分布不均衡-解决方案-损失函数(一)：Focal Loss

统计机器学习标注图片中各个类别的样本样以及检查特殊样本数量

Python matplotlib数据可视化绘制柱形图、堆叠图、折线图、饼图和环图

使用Counter统计各类别的数目

Echarts--Js可视化实现[视觉盛宴]--动态三维条形图、柱状图、饼图、比例图、折线图

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)