文章目录

笔记补充
一绘制简单的折线图
二随机漫步
三使用Pygal模拟掷骰子

笔记补充

笔者使用的是python3.7的版本，使用3.10时会出现导入错误。其它模块都是Pycharm直接安装的。

一绘制简单的折线图

import matplotlib.pyplot as plt

squares = [1, 4, 9, 16, 25]
plt.plot(squares)
plt.show()

此时我们导入了模块pyplot，并给它指定别名plt，以免反复输入 pyplot 。
在线示例大都这样做，因此这里也这样做。模块 pyplot 包含很多用于生成图表的函数。

1.修改标签文字与线条粗细

import matplotlib.pyplot as plt

squares = [1, 4, 9, 16, 25]
plt.plot(squares,linewidth=5)

# 设置图表标题，并给坐标加上标签
plt.title("Squre Numbers",fontsize=24)
plt.xlabel("Value",fontsize=4)
plt.ylabel("Square of Value",fontsize=14)

# 设置刻度标记的大小
plt.tick_params(axis='both',labelsize=14)

plt.show()

2.校正图形

我们需要同时给plot提供输入值和输出值。使其无需对输出值的生成方式做出假设.

import matplotlib.pyplot as plt

input_value = [1, 2, 3, 4, 5]
squares = [1, 4, 9, 16, 25]
plt.plot(input_value,squares,linewidth=5)

# 设置图表标题，并给坐标加上标签
plt.title("Squre Numbers",fontsize=24)
plt.xlabel("Value",fontsize=4)
plt.ylabel("Square of Value",fontsize=14)

# 设置刻度标记的大小
plt.tick_params(axis='both',labelsize=14)

plt.show()

使用plot()可以指定各种实参，还可以使用众多函数对图形进行定制

3.使用scatter()绘制散点图并设置其样式

有时我们绘制散点图需要设置各个数据点的样式。
要绘制单个点，我们可以使用函数scatter()，并向它传递一对x和y坐标，它将在指定位置绘制一个点：

import matplotlib.pyplot as plt

plt.scatter(2, 4)
plt.show()

我们设计输出样式

import matplotlib.pyplot as plt

plt.scatter(2,4,s=200)

# 设置图表标题并给坐标轴加上标签
plt.title("Square Numbers",fontsize=24)
plt.xlabel("Value",fontsize=14)
plt.ylabel("Square of Value",fontsize=14)

# 设置刻度标记的大小
plt.tick_params(axis='both',which='major',labelsize=14)

plt.show()

这里我们调用scatter()函数，并使用实参s设置了绘制图形时使用点的尺寸

4.使用scatter()绘制一系列点

我们可以给scatter()传递两个分别包含x值，y值的列表

# 使用scatter绘制一系列点
import matplotlib.pyplot as plt

x_values = [1,2,3,4,5]
y_values = [1,4,9,16,25]

plt.scatter(x_values,y_values,s=100)

# 设置图表标题并给坐标轴指定标签
plt.title("Square Numbers",fontsize=24)
plt.xlabel("Value",fontsize=14)
plt.ylabel("Square of Value",fontsize=14)

# 设置刻度标记的大小
plt.tick_params(axis='both',which='major',labelsize=14)

plt.show()

5.自动计算数据

# 绘制1000个点，且自动计算
import matplotlib.pyplot as plt

x_values = list(range(1,1001))
y_values = [x**2 for x in x_values]

plt.scatter(x_values,y_values,s=40)

# 设置图表标题并给坐标轴指定标签
plt.title("Square Numbers",fontsize=24)
plt.xlabel("Value",fontsize=14)
plt.ylabel("Square of Value",fontsize=14)

# 设置刻度标记的大小
plt.tick_params(axis='both',which='major',labelsize=14)

# 设置每个坐标轴的取值范围
plt.axis([0,1100,0,1100000])

plt.show()

我们首先创建一个包含x值的列表，其中包含数字1~1000，接下来生成一个y值的列表。它遍历x值，并计算其平方值

6.删除数据点的轮廓

matplotlib运行我们给散点图的各个点指定颜色。默认蓝色点和黑色轮廓。绘制很多点时黑色轮廓可能会粘连在一起。
要删除数据的轮廓，可以调用scatter()时传递实参edgecolor=‘none’:

# plt.scatterx(x_values,y_values,edgecolor='none',s=40)

7.自定义颜色

需要自定义颜色时，传递参数c，同样也可以使用RGB颜色模式自定义颜色

# plt.scatter(x_values,y_values,c='red',edgecolors='none',s=40)

8.使用颜色映射

颜色映射是一系列颜色，它们从起始颜色到渐变到结束颜色。在可视化中，颜色映射用于突出数据的规律。

import  matplotlib.pyplot as plt

x_values = list(range(1001))
y_values = [x**2 for x in x_values]

plt.scatter(x_values,y_values,c=y_values,cmap=plt.cm.Blues,edgecolors='none',s=40)

# 设置图表标题并给坐标轴指定标签
plt.title("Square Numbers",fontsize=24)
plt.xlabel("Value",fontsize=14)
plt.ylabel("Square of Value",fontsize=14)

# 设置刻度标记的大小
plt.tick_params(axis='both',which='major',labelsize=14)

# 设置每个坐标轴的取值范围
plt.axis([0,1100,0,1100000])

plt.show()

此时我们将y值设置成一个y值列表，并使用参数camp告诉pyplot该使用哪个颜色映射。
这些代码将 y 值较小的点显示为浅蓝色，并将 y 值较大的点显示为深蓝色。

9.自动保存图表

需要吧图表保存在文件中，可以吧plt.show()改为plt.savefig()的调用,理论上可以同时使用

# plt.savefig('1.png',bbox_inches='tight')

第一个实参指定要以什么样的文件名保存图表，这个文件将存储到 scatter_squares.py 所在的目录中；
第二个实参指定将图表多余的空白区域裁剪掉。如果要保留图表周围多余的空白区域，可省略这个实参。

二随机漫步

1.创建RandomWalk()类

RandomWalk()类只包含两个方法：init()与fill_walk(),后者计算随机漫步经过的所有点。

class RandomWalk():
    """一个生成随机漫步数据的类"""

    def __init__(self,num_points=5000):
        """初始化随机漫步的属性"""
        self.num_points = num_points

        # 所有随机漫步都始于(0,0)
        self.x_values = [0]
        self.y_values = [0]

为了做出随机决策，我们要把所有可能的选择都放在一个列表里

2.选择方向

from random import choice

class RandomWalk():
    """一个生成随机漫步数据的类"""

    def __init__(self,num_points=5000):
        """初始化随机漫步的属性"""
        self.num_points = num_points

        # 所有随机漫步都始于(0,0)
        self.x_values = [0]
        self.y_values = [0]

    def fill_walk(self):
        """计算随机漫步包含的所有点"""

        # 不断漫步，直到列表到达指定长度
        while len(self.x_values) < self.num_points:
            # 决定前进方向以及沿这个方向前进的距离
            x_direction = choice([1,-1])
            x_distance = choice([0,1,2,3,4])
            x_step = x_distance * x_direction

            y_direction = choice([1,-1])
            y_distance = choice([0,1,2,3,4])
            y_step = y_distance * y_direction
            
            # 拒绝原地踏步
            if x_step == 0 and y_step == 0:
                continue
                
            # 计算下一个点x和y的值
            next_x = self.x_values[-1] + x_step
            next_y = self.y_values[-1] + y_step
            
            self.x_values.append(next_x)
            self.y_values.append(next_y)

此时我们建立了一个循环，这个循环不断运行，直到漫步包含所需数量的点。
我们将移动方向乘以移动距离，以确定沿 x 和 y 轴移动的距离。
如果 x_step 为正，将向右移动，为负将向左移动，而为零将垂直移动；
如果 y_step 为正，就意味着向上移动，为负意味着向下移动，而为零意味着水平移动。
如果 x_step 和 y_step 都为零，则意味着原地踏步，我们拒绝这样的情况，接着执行下一次循环

3.绘制随机漫步图

import matplotlib.pyplot as plt

from random_walk import RandomWalk

# 创建一个RandomWalk实例，并将其包含的点都绘制出来
rw = RandomWalk()
rw.fill_walk()
plt.scatter(rw.x_values,rw.y_values,s=15)
plt.show()

我们首先导入了模块pyplot和RandomWalk类，然后创建一个RandomWalk实例，并将其存储在rw中，再调用fill_walk

4.模拟多次随机漫步

import matplotlib.pyplot as plt

from random_walk import RandomWalk

# 只要程序处于活动状态，就不断模拟随机漫步
while True:
    # 创造一个RandomWalk实例，并不断模拟随机漫步
    rw = RandomWalk()
    rw.fill_walk()
    plt.scatter(rw.x_values,rw.y_values,s=15)
    plt.show()

    keep_running = input("Make another walk?(y/n)")
    if keep_running == 'n':
        break

这些代码模拟一次随机漫步，在 matplotlib 查看器中显示结果，再在不关闭查看器的情况下暂停。如果你关闭查看器，程序将询问你是否要再模拟一次随机漫步。如果你输入 y ，可
模拟多次随机漫步：这些随机漫步都在起点附近进行，大多沿特定方向偏离起点，漫步点分布不均匀等。要结束程序，请输入 n 。

5.设计随机漫步图的样式

我们需要定制图表，以突出每次漫步的重要特征，并让分散注意力的元素不那么显眼。为此，我们确定要突出的元素，如漫步的起点、终点和经过的路径。接下来确定
要使其不那么显眼的元素，如刻度标记和标签。最终的结果是简单的可视化表示，清楚地指出了每次漫步经过的路径。

6.给点着色

我们将用颜色映射来指出漫步各点的先后顺序，并删除每个点的黑色轮廓，使他们颜色更明显。为根据漫步中各点的先后顺序。

import matplotlib.pyplot as plt

from random_walk import RandomWalk

# 只要程序处于活动状态，就不断模拟随机漫步
while True:
    # 创造一个RandomWalk实例，并不断模拟随机漫步
    rw = RandomWalk()
    rw.fill_walk()

    point_numbers = list(range(rw.num_points))
    plt.scatter(rw.x_values, rw.y_values, c=point_numbers, cmap=plt.cm.Blues,
                edgecolor='none', s=15)
    plt.show()

    keep_running = input("Make another walk?(y/n)")
    if keep_running == 'n':
        break

我们使用range()生成了一个数字列表，其中包含的数字个数和漫步包含的点数相同。
接下来，我们将这个列表存储在 point_numbers 中，以便后面使用它来设置每个漫步点的颜色。
我们将参数 c 设置为 point_numbers ，指定使用颜色映射 Blues ，并传递实参 edgecolor=none 以删除每个点周围的轮廓。

7.重新绘制起点与终点

我们使用绿色绘制点(0,0)，并使其比其它点大。为突出终点，我们在漫步包含的最后一个 x 和 y 值处绘制一个点，将其颜色设置为红色，并将尺寸设置为 100 。

import matplotlib.pyplot as plt
from random_walk import RandomWalk

# 只要程序处于活动状态，就不断模拟随机漫步
while True:
    # 创造一个RandomWalk实例，并不断模拟随机漫步
    rw = RandomWalk()
    rw.fill_walk()

    point_numbers = list(range(rw.num_points))
    plt.scatter(0,0,c='green',edgecolors='none',s=100)
    plt.scatter(rw.x_values[-1], rw.y_values[-1], c='red',edgecolor='none', s=100)
    plt.show()

    keep_running = input("Make another walk?(y/n)")
    if keep_running == 'n':
        break

8.隐藏坐标轴

为修改坐标轴，使用了函数 plt.axes()来将每条坐标轴的可见性都设置为 False 。

# 隐藏坐标轴
plt.axes().get_xaxis().set_visible(False)
plt.axes().get_yaxis().set_visible(False)

9.增加点数

我们只需要在创建实例时增大num_points的值，并记得把点的大小调小。

rw = RandomWalk(50000)
rw.fill_walk()

10.调整尺寸以适合屏幕

我们可以把图表变得适合屏幕，可以这样输入尺寸

# 设置绘图窗口的尺寸
plt.figure(figsize=(10,6))

函数 figure() 用于指定图表的宽度、高度、分辨率和背景色。
你需要给形参 figsize 指定一个元组，向 matplotlib 指出绘图窗口的尺寸，单位为英寸。

三使用Pygal模拟掷骰子

1.创建Die类

from random import randint

class Die(object):
    """表示一个骰子的类"""

    def __init__(self,num_sides=6):
        """骰子为六面"""
        self.num_sides = num_sides

    def roll(self):
        """返回一个1~骰子面数的随机值"""
        return randint(1,self.num_sides)

方法 roll() 使用函数 randint() 来返回一个 1 和面数之间的随机数。

2.掷骰子

from die import Die

# 创建一个D6
die = Die()

# 掷几次骰子，把结果存储在一个列表中
results = []
for roll_num in range(100):
    result = die.roll()
    results.append(result)

print(results)

创造一个列表把所有结果存储进去。

3.分析结果

from die import Die

# 创建一个D6
die = Die()

# 掷几次骰子，把结果存储在一个列表中
results = []
for roll_num in range(1000):
    result = die.roll()
    results.append(result)

# 分析结果
frequencise = []
for value in range(1, die.num_sides+1):
    frequency = results.count(value)
    frequencise.append(frequency)

print(frequencise)

我们遍历可能的点数（这里为 1~6 ），计算每种点数在 results 中出现了多少次，并将这个值附加到列表 frequencies 的末尾。

4.绘制直方图

from die import Die
import pygal
# 创建一个D6
die = Die()

# 掷几次骰子，把结果存储在一个列表中
results = []
for roll_num in range(1000):
    result = die.roll()
    results.append(result)

# 分析结果
frequencise = []
for value in range(1, die.num_sides+1):
    frequency = results.count(value)
    frequencise.append(frequency)

# 对结果进行可视化
hist = pygal.Bar()

hist.title = "Results of rolling one D6 1000 times."
hist.x_labels = ['1', '2', '3', '4', '5', '6']
hist.x_title = "Result"
hist.y_title = "Frequency of Result"

hist.add('D6', frequencise)
hist.render_to_file('die_visual.svg')

为创建条形图，我们创建了一个 pygal.Bar() 实例，并将其存储在 hist 中。接下来，我们设置 hist 的属性 title （用于标示直方图的字符串），将掷 D6 骰子的可
能结果用作 x 轴的标签，并给每个轴都添加了标题。然后，我们使用 add() 将一系列值添加到图表中（向它传递要给添加的值指定的标签，还有一个列表，其中包含
将出现在图表中的值）。最后，我们将这个图表渲染为一个 SVG 文件，这种文件的扩展名必须为 .svg 。

5.同时掷两个骰子

from die import Die
import pygal

# 创建两个D6骰子
die_1 = Die()
die_2 = Die()

# 掷几次骰子，并将结果存储在一个列表中
results = []
for roll_num in range(1000):
    result = die_1.roll() + die_2.roll()
    results.append(result)

# 分析结果
frequencies = []
max_result = die_1.num_sides + die_2.num_sides
for value in range(1, max_result + 1):
    frequency = results.count(value)
    frequencies.append(frequency)

# 对结果进行可视化
hist = pygal.Bar()  # 创建一个实例，并将其储存在hist中

hist.title = "Result of rolling two D6 1000 times."  # hist标题
hist.x_labels = ['2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12']
hist.x_title = "Result"
hist.y_title = "Frequency of Result"

hist.add('D6+D6', frequencies)  # 将一系列值添加到图标中
hist.render_to_file('dice_visual1.svg')  # 将图标渲染为一个svg文件

6.同时掷两个点数不同的骰子

同时掷两个骰子时，得到的点数更多，结果分布情况也不同。下面来修改前面的代码，创建两个 D6 骰子，以模拟同时掷两个骰子的情况。每次掷两个骰子时，我们都将两个骰子
的点数相加，并将结果存储在 results 中。

from die import Die
import pygal

# 建一个D6与一个D10
die_1 = Die()
die_2 = Die(10)

# 掷骰子多次，将结果存储在一个列表中
results = []
for roll_num in range(50000):
    result = die_1.roll() + die_2.roll()
    results.append(result)

# 分析结果
frequencies = []
max_result = die_1.num_sides + die_2.num_sides
for value in range(1, max_result + 1):
    frequency = results.count(value)
    frequencies.append(frequency)

# 可视化结果
hist = pygal.Bar()  # 创建一个实例，并将其储存在hist中

hist.title = "Result of rolling a D6 and a D10 50000 times."  # hist标题
hist.x_labels = ['2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12',
                 '13','14','15','16']
hist.x_title = "Result"
hist.y_title = "Frequency of Result"

hist.add('D6+D10', frequencies)  # 将一系列值添加到图标中
hist.render_to_file('dice_visual2.svg')  # 将图标渲染为一个svg文件

简单的Python项目——可视化数据入门（关键词：matplotlib，pyolot，pygal）

文章目录

笔记补充

一绘制简单的折线图

1.修改标签文字与线条粗细

2.校正图形

3.使用scatter()绘制散点图并设置其样式

4.使用scatter()绘制一系列点

5.自动计算数据

6.删除数据点的轮廓

7.自定义颜色

8.使用颜色映射

9.自动保存图表

二随机漫步

1.创建RandomWalk()类

2.选择方向

3.绘制随机漫步图

4.模拟多次随机漫步

5.设计随机漫步图的样式

6.给点着色

7.重新绘制起点与终点

8.隐藏坐标轴

9.增加点数

10.调整尺寸以适合屏幕

三使用Pygal模拟掷骰子

1.创建Die类

2.掷骰子

3.分析结果

4.绘制直方图

5.同时掷两个骰子

6.同时掷两个点数不同的骰子

猜你喜欢

简单的Python项目——可视化数据入门（关键词：matplotlib，pyolot，pygal）

文章目录

笔记补充

一 绘制简单的折线图

1.修改标签文字与线条粗细

2.校正图形

3.使用scatter()绘制散点图并设置其样式

4.使用scatter()绘制一系列点

5.自动计算数据

6.删除数据点的轮廓

7.自定义颜色

8.使用颜色映射

9.自动保存图表

二 随机漫步

1.创建RandomWalk()类

2.选择方向

3.绘制随机漫步图

4.模拟多次随机漫步

5.设计随机漫步图的样式

6.给点着色

7.重新绘制起点与终点

8.隐藏坐标轴

9.增加点数

10.调整尺寸以适合屏幕

三 使用Pygal模拟掷骰子

1.创建Die类

2.掷骰子

3.分析结果

4.绘制直方图

5.同时掷两个骰子

6.同时掷两个点数不同的骰子

猜你喜欢

一绘制简单的折线图

二随机漫步

三使用Pygal模拟掷骰子