在视频教程中,我们了解到离散型变量可以使用seaborn分类模块中的各种图形来探索其分布情况。接下来的学习过程中,我们将会对分类模块中的主要画图函数逐一讲解。
1.seaborn分类模块介绍
在seaborn的分类模块下, 可以分为:分类估计图、分类散点图、分类分布图。接下来我们首先讲解分类估计图的两个画图函数。
- sns.countplot: 用条形图显示每个分类箱中的观测值。
- sns.barplot: 将点估计和置信区间显示为矩形条。
2.sns.countplot()
sns.countplot() 用于类别特征的频数条形图,可以画类别特征和y值(y值特征也是类比的话)的条形图。主要参数有:
- x,y:numpy数组或pandas系列的数据向量对象直接传递给x轴或y轴
- data:DataFrame对象或者array对象,或者是列表对象,分别使用x,y参数来指定特定变量名称。
比如,下表bj记录了北京不同城区房价信息,其中字段“城区”记录了城区归属信息:
则以下代码都可以画出字段“城区”的条形图:
sns.countplot(bj.城区)
sns.countplot(data=bj, x='城区')
输出的图形是一样的,如下:
尝试在右上角代码框,使用"城区"字段,画出该字段垂直于y轴的条形图?