python爬虫之绘图matplotlib与词云(七)

1 绘制条形图

13406307-e54cfa8efa2cc424.png

2 绘制智联招聘职位岗位数量图

13406307-09e434de6fc799d7.png

3 词云

“词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)提出。“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。

词频

分词 语句切割

13406307-c3f3bd0ada7e1cc7.png

读取文本

13406307-4bd30e2a1d172b82.png

切割

13406307-53376a0e8bc0b16e.png

精简生成词云

13406307-913776bc76dd190c.png

4 Matplotlib 绘图

1 多个subplot

13406307-d956b1e062885f3f.png

13406307-3e8cf3d69ebdf586.png

2 线形图

13406307-e598c46b4905da32.png


13406307-2cfa4653c8c438de.png

这段代码说明如下:

plot函数的第一个数组是横轴的值,第二个数组是纵轴的值,所以它们一个是直线,一个是折线;

最后一个参数是由两个字符构成的,分别是线条的样式和颜色。前者是红色的直线,后者是绿色的点线。

3 散点图

13406307-1d211704170bcda6.png


13406307-6d29ba7fdb576439.png

这段代码说明如下:

这幅图包含了三组数据,每组数据都包含了20个随机坐标的位置

参数c表示点的颜色,s是点的大小,alpha是透明度

4 饼状图

13406307-765abf48a6e743ce.png


13406307-f0788c6cc5f938a5.png

这段代码说明如下:

data是一组包含7个数据的随机数值

图中的标签通过labels来指定

autopct指定了数值的精度格式

plt.axis('equal')设置了坐标轴大小一致

plt.legend()指明要绘制图例(见下图的右上角)

5 条形图

13406307-5a82b07b4ae326bc.png

13406307-d878a1eb44d7bdfe.png

这段代码说明如下:

这幅图展示了一组包含7个随机数值的结果,每个数值是[0, 100]的随机数

它们的颜色也是通过随机数生成的。np.random.rand(N * 3).reshape(N, -1)表示先生成21(N x 3)个随机数,然后将它们组装成7行,那么每行就是三个数,这对应了颜色的三个组成部分。如果不理解这行代码,请先学习一下Python 机器学习库 NumPy 教程

title指定了图形的标题,labels指定了标签,alpha是透明度

6 直方图

13406307-8988dbbe3538cc02.png


13406307-ae6312c9bb255272.png

上面这段代码中,[np.random.randint(0, n, n) for n in [3000, 4000, 5000]]生成了包含了三个数组的数组,这其中:

第一个数组包含了3000个随机数,这些随机数的范围是 [0, 3000)

第二个数组包含了4000个随机数,这些随机数的范围是 [0, 4000)

第三个数组包含了5000个随机数,这些随机数的范围是 [0, 5000)

转载于:https://www.jianshu.com/p/f43e3ef31770

猜你喜欢

转载自blog.csdn.net/weixin_33696106/article/details/91073215
今日推荐