Matplotlib - 绘制 带有对角线的散点图 (Diagonal Scatter Plots) 函数源码

欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://blog.csdn.net/caroline_wendy/article/details/131384440

Scatter Plots

Matplotlib 是一个用于绘制二维图形的 Python 库,提供了一个 pyplot 模块,用于创建各种类型的图表。其中一种图表是散点图(Scatter Plots),用于展示两个变量之间的关系,以及数据的分布情况。要绘制散点图,使用 pyplot.scatter() 函数,接受以下参数:

  • x, y:表示数据点的横纵坐标,可以是浮点数或者数组。
  • s:表示数据点的大小,可以是一个常数或者一个数组,单位是点的平方(1 点 = 1/72 英寸)。
  • c:表示数据点的颜色,可以是一个常数、一个数组、一个颜色序列或者一个颜色字符串。如果是一个数组,那么会根据 cmap 参数来映射颜色;如果是一个颜色序列,那么长度必须和数据点相同;如果是一个颜色字符串,那么所有数据点都使用该颜色。
  • marker:表示数据点的形状,可以是一个 MarkerStyle 实例或者一个简写字符串。详细的形状列表可以参考 matplotlib.markers 文档。
  • cmap:表示用于映射颜色的 Colormap 实例或者注册的颜色图名称。如果 c 是 RGB(A) 值,那么该参数会被忽略。
  • norm:表示用于将数据标准化到 [0, 1] 区间的 Normalize 实例或者名称。默认情况下,使用线性标准化,将最小值映射到 0,最大值映射到 1。如果 c 是 RGB(A) 值,那么该参数会被忽略。
  • vmin, vmax:当使用标量数据并且没有指定 norm 时,vmin 和 vmax 定义了颜色图覆盖的数据范围。默认情况下,颜色图覆盖了所有数据的值域。

主要:

  1. 设置主题:sns.set_theme(style="white")
  2. 设置 Figure 尺寸:fig.set_size_inches(10, 10)
  3. 绘制对角线:ax.plot()
  4. 绘制散点图:ax.scatter()
  5. 绘制标注:ax.annotate()

源码如下:

#!/usr/bin/env python
# -- coding: utf-8 --
"""
Copyright (c) 2022. All rights reserved.
Created by C. L. Wang on 2023/6/25
"""
import os

import seaborn as sns

sns.set_theme(style="white")

import matplotlib.pyplot as plt
import numpy as np

from myutils.project_utils import read_excel_to_df
from root_dir import DATA_DIR


def draw_diagonal_scatter_plots(
    data_better, data_ref, label_list,
    min_scale=0.0, max_scale=1.05,
    x_label="", y_label="",
    save_name=""
):
    """
    绘制对角线散点图

    :param data_better: 优质数据,数据位于右下方
    :param data_ref:    对比数据
    :param label_list:  标签
    :param min_scale:   最小范围
    :param max_scale:   最大范围
    :param x_label:     x轴描述
    :param y_label:     y轴描述
    :param save_name:   文件存储
    :return: 图
    """
    assert len(data_ref) == len(data_better) == len(label_list)

    fig, ax = plt.subplots()
    fig.set_size_inches(10, 10)

    ax.grid(True)
    ax.plot([min_scale, max_scale], [min_scale, max_scale], ls="--", c=".3")
    ax.scatter(data_ref, data_better, s=100, edgecolors="black")

    plt.xlim(min_scale, max_scale)
    plt.ylim(min_scale, max_scale)
    plt.xticks(fontsize=15)
    plt.yticks(fontsize=15)
    plt.xlabel(x_label, fontsize=20)
    plt.ylabel(y_label, fontsize=20)

    for i, txt in enumerate(label_list):
        if data_ref[i] - data_better[i] > 0.025:
            ax.annotate(txt, (data_ref[i] * 1.03, data_better[i]), fontsize=10, fontweight='bold')

    if save_name:
        # transparent=True
        assert save_name.endswith("png") or save_name.endswith("jpg")
        plt.savefig(save_name, bbox_inches='tight', format='png')

    plt.show()


def main():
    df = read_excel_to_df(os.path.join(DATA_DIR, "Strategy-v1v2v3v4-TMScore.xls"))
    data1 = df["m0-score"]
    data2 = df["max-score"]
    label_list = df["target"]
    print(f"data1 : {
      
      round(float(np.mean(data1)) * 100, 4)}±{
      
      round(float(np.std(data1)), 4)}")
    print(f"data2 : {
      
      round(float(np.mean(data2)) * 100, 4)}±{
      
      round(float(np.std(data2)), 4)}")
    draw_diagonal_scatter_plots(data1, data2, label_list, min_scale=0.35, max_scale=1.05,
                                x_label="Our P.S.P. (TMScore)", y_label="CASP15 SOTA (TMScore)",
                                save_name="img.png")


if __name__ == '__main__':
    main()

猜你喜欢

转载自blog.csdn.net/u012515223/article/details/131384440