百木园-与人分享,
就是让自己快乐。

python数据可视化-matplotlib入门(5)-饼图和堆叠图

饼图常用于统计学模块,画饼图用到的方法为:pie( )

一、pie()函数用来绘制饼图

pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistance=0.6, shadow=False, labeldistance=1.1, startangle=0, radius=1, counterclock=True, wedgeprops=None, textprops=None, center=0, 0, frame=False, rotatelabels=False, *, normalize=None, data=None)

pie()函数参数较多,需要我们调整的常见为以下几个
x: 每个扇形的占比的序列或数组
explode :如果不是None,则是一个len(x)长度的数组,指定每一块的突出程度;突出显示,设置每一块分割出来的间隙大小
labels:为每个扇形提供标签的字符串序列
colors:为每个扇形提供颜色的字符串序列
autopct :如果是一个格式字符串,标签将是fmt % pct。如果是一个函数,它将被调用。
shadow:阴影
startangle:从x轴逆时针旋转,饼的旋转角度  参数用法,可以去官网查询,并自己多去偿试。

二、一个简单的例子:统计每天休息、工作、娱乐等时间的百分比

import matplotlib.pyplot as plt

slices = [7,2,9,3,3]
activities = [\'sleeping\',\'eating\',\'working\',\'studing\',\'playing\']
cols = [\'r\',\'m\',\'y\',\'c\',\'b\']

plt.pie(slices,
        labels=activities,
        colors=cols,  #自定义的颜色序列,对比slices,可多可少,少时自动补充,如没有,则默认不同颜色。
        startangle=90,
        shadow= True, 
        explode=(0,0.1,0,0,0.2),#占比突出程度,
        autopct=\'%1.1f%%\' #百分比的显示格式
        )

plt.title(\'Time statistics\')
plt.show()

实际运行结果:

注意:startangle=90时的开始位置。整个饼图是从0度(圆心向右方向)逆时针分布的。

那继续用上篇创建的2个色子,来实现一个饼图。

思考:上述饼图代码中最能决定饼图形状的参数是slices = [7,2,9,3,3],在不考虑每个占比名称、美观等的情况下,先确定如何实现slices中的各数值。

比如,当投掷2粒色子(一个8个面,一个6个面)时,1000000次时,分别统计出现点1、2、3、4、5……14的总次数,保存到slices中即可。用数列中的统计方法 list.count()即可。

主要就是增加两行代码:

new_slices=[] # 新建一个数列

while side <= max_result: 
    side += 1 
    new_bins.append(side) #这是之前做柱状图需要用到的
    new_slices.append( results.count(int(side))  ) #将保存两色子之和的数列,直接进行统计,results.count(int(side))就是在results的数列中统计出现side的次数。

运行结果,一样也是显示出点数之和7,8,9的出现的次数最多,然后逐渐减小:

总之,饼图通过将一个圆按照分类的占比划分成多个区块,整个圆饼代表数据的总量,每个区块表示该分类占总体的比例大小,所有区块的加和等于100%。

三、 堆叠图

使用matplotlib中的stackplot()函数可以快速绘制堆积图,stackplot()函数的语法格式如下所示
stackplot(x, y, labels=(), baseling=\'zero\', data=None, *args, **kwargs)

该函数常用参数的含义如下   

x:表示x轴的数据,可以是一维数组。   
y:表示y轴的数据,可以是二维数组或一维数组序列。  
labels:表示每组折线及填充区域的标签。   
baseline:表示计算基线的方法,包括\'zero\'、\'sym\'、\'wiggle\'和\'weighted_wiggle\'。
其中,\'zero\'表示恒定零基线,即简单的堆积图;
     \'sym\'表示对称于零基线;
   \'wiggle\'表示最小化平方斜率的总和;
     \'weighted_wiggle\'表示执行相同的操作,但权重用于说明每层的大小。

用同一个例子来看一下堆叠图的效果,代码如下:

import matplotlib.pyplot as plt

days =    [1,2,3,4,5,6,7]

sleeping =[7,8,6,8,7,8,6]
eating  = [2,3,3,3,2,2,2]
working = [7,7,7,8,10,3,4]
studing = [6,4,4,4,3,8,11]
playing = [2,2,4,1,2,3,1]

labellist = [\'sleeping\',\'eating\',\'working\',\'studing\',\'playing\']
colorlist = [\'c\',\'y\',\'b\',\'r\',\'g\']

plt.stackplot(days, sleeping,eating,working,studing,playing,labels=labellist,colors=colorlist)
plt.xlabel(\'x\')
plt.ylabel(\'y\')
plt.legend(loc=(0.07, 0.05))
plt.title(\'Stack Plots\')
plt.show()

运行结果如下:

plt.legend()是显示左下角的标签。而语句plt.stackplot()函数中的sleeping,eating,working,studing,playing是一维数组序列,即stackplot(x,y……)中的y值,是一系列一维数据。

 很明显,通过上述饼图与堆叠图的对比,它们的区别:饼图只能展示一段时间里,某个项目所花时间占总时间的比,而堆叠图可以展示这一段时间里,每天各项所花费时间。

既然sleeping,eating,working,studing,playing形成的一维数组,感觉参数比较多,那直接形成一个二维数组如何?做如下修改:

days =    [1,2,3,4,5,6,7]
\"\"\"
sleeping =[7,8,6,8,7,8,6]
eating  = [2,3,3,3,2,2,2]
working = [7,7,7,8,10,3,4]
studing = [6,4,4,4,3,8,11]
playing = [2,2,4,1,2,3,1]
\"\"\"
times =[                   # 二维数组,以数列作为元素的数列。
        [7,8,6,8,7,8,6],   #上述sleeping数列
        [2,3,3,3,2,2,2],
        [7,7,7,8,10,3,4],
        [6,4,4,4,3,8,11],
        [2,2,4,1,2,3,1]
        ]
plt.stackplot(days, times,labels=labellist,colors=colorlist)

运行结果如图:

效果与原来的一维数组一样。

但手工这样编程的时候录入数据太过麻烦,下篇介绍直接读取文件数据并进行处理。


来源:https://www.cnblogs.com/codingchen/p/16199537.html
本站部分图文来源于网络,如有侵权请联系删除。

未经允许不得转载:百木园 » python数据可视化-matplotlib入门(5)-饼图和堆叠图

相关推荐

  • 暂无文章