matplotlib.pyplot.boxplot #
- matplotlib.pyplot。boxplot ( x , notch = None , sym = None , vert = None , whis = None , position = None , widths = None , patch_artist = None , bootstrap = None , usermedians = None , conf_intervals = None , meanline = None , showmeans= None , showcaps = None , showbox = None , showfliers = None , boxprops = None , labels = None , flierprops = None , medianprops = None , meanprops = None , capprops = None , whiskerprops = None , manage_ticks = True , autorange = False, zorder = None , capwidths = None , * , data = None ) [来源] #
绘制箱须图。
方框从数据的第一个四分位数 (Q1) 延伸到第三个四分位数 (Q3),中间有一条线。晶须从盒子延伸到四分位间距 (IQR) 的 1.5 倍。飞行点是那些超过胡须末端的点。请参阅https://en.wikipedia.org/wiki/Box_plot以供参考。
Q1-1.5IQR Q1 median Q3 Q3+1.5IQR |-----:-----| o |--------| : |--------| o o |-----:-----| flier <-----------> fliers IQR
- 参数:
- x数组或向量序列。
输入数据。如果是二维数组,则会为x中的每一列绘制一个箱线图。如果是一维数组序列,则为x中的每个数组绘制箱线图。
- 缺口布尔值,默认值:False
是绘制凹口箱线图 (
True
) 还是矩形箱线图 (False
)。缺口代表中位数周围的置信区间 (CI)。bootstrap的文档 描述了默认情况下如何计算凹槽的位置,但它们的位置也可以通过设置 conf_intervals参数来覆盖。笔记
在 CI 值小于下四分位数或大于上四分位数的情况下,缺口将延伸到盒子之外,使其具有独特的“翻转”外观。这是预期的行为,并且与其他统计可视化包一致。
- sym str,可选
飞行点的默认符号。空字符串 ('') 隐藏传单。如果
None
,则传单默认为“b+”。flyerprops参数提供了更多控制。- vert bool,默认值:True
- whis float 或 (float, float),默认值:1.5
胡须的位置。
如果是浮点数,则下须线位于上方的最低基准处 ,而上方的须位于下方的最高基准处,其中 Q1 和 Q3 是第一和第三四分位数。的默认值对应于 Tukey 对箱线图的原始定义。
Q1 - whis*(Q3-Q1)
Q3 + whis*(Q3-Q1)
whis = 1.5
如果是一对浮点数,它们表示绘制胡须的百分位数(例如,(5, 95))。特别是,将其设置为 (0, 100) 会导致胡须覆盖整个数据范围。
在边缘情况下,如果autorange为 True, whis会自动设置为 (0, 100)(覆盖整个数据范围)。
Q1 == Q3
除了胡须,数据被认为是异常值,并被绘制为单个点。
- 引导int,可选
指定是否在缺口箱线图的中位数附近引导置信区间。如果bootstrap为 None,则不执行 bootstrap,并且使用基于高斯的渐近近似计算缺口(参见 McGill, R.、Tukey, JW 和 Larsen, WA, 1978 以及 Kendall 和 Stuart, 1967)。否则,bootstrap 指定引导中位数以确定其 95% 置信区间的次数。建议使用 1000 到 10000 之间的值。
- usermedians一维数组,可选
一个类似长度的一维数组
len(x)
。每个不是None
强制对应数据集的中值的条目。对于 的条目,None
中位数由 Matplotlib 正常计算。- conf_intervals 类数组,可选
形状的二维数组。不是 None 的每个条目都会强制相应凹槽的位置(仅当凹槽为时才绘制)。对于 是的条目,缺口由其他参数(例如bootstrap)指定的方法计算。
(len(x), 2)
True
None
- 位置类数组,可选
箱子的位置。刻度线和限制会自动设置以匹配位置。默认为 其中 N 是要绘制的框数。
range(1, N+1)
- 宽度浮动或类似数组
盒子的宽度。默认值为 0.5,或者如果更小,则为 。
0.15*(distance between extreme positions)
- patch_artist布尔值,默认值:False
如果
False
使用 Line2D 艺术家生成框。否则,将使用 Patch 艺术家绘制框。- 标签序列,可选
每个数据集的标签(每个数据集一个)。
- manage_ticks布尔值,默认值:True
如果为 True,将调整刻度位置和标签以匹配箱线图位置。
- 自动范围布尔值,默认值:False
当
True
和 数据分布使得第 25 个和第 75 个百分位数相等时,将 whis设置为 (0, 100) 以使须线末端位于数据的最小值和最大值处。- meanline布尔值,默认值:False
如果
True
(并且showmeans是),将尝试根据meanpropsTrue
将均值渲染为跨越框的整个宽度的线 (见下文)。如果shownotches也是 True,则不推荐。否则,均值将显示为点。- zorder浮点数,默认值:
Line2D.zorder = 2
箱线图的 zorder。
- 返回:
- 听写
Line2D
将箱线图的每个组件映射到创建的实例列表的字典。该字典具有以下键(假设垂直箱线图):boxes
:箱线图的主体显示四分位数和中位数的置信区间(如果启用)。medians
:每个盒子中间的水平线。whiskers
:延伸到最极端的非异常数据点的垂直线。caps
:胡须末端的水平线。fliers
: 表示超出胡须(传单)的数据的点。means
: 代表手段的点或线。
- 其他参数:
- showcaps布尔值,默认值:True
显示胡须末端的帽子。
- showbox布尔值,默认值:True
显示中央框。
- showflyers bool,默认值:True
显示超出上限的异常值。
- showmeans布尔值,默认值:False
显示算术平均值。
- capprops字典,默认值:无
帽子的样式。
- capwidths浮点数或数组,默认值:无
帽子的宽度。
- boxprops字典,默认值:无
盒子的样式。
- 胡须道具字典,默认值:无
胡须的样式。
- flyerprops字典,默认值:无
传单的风格。
- 中值属性字典,默认值:无
中位数的样式。
- meanprops字典,默认值:无
中庸的风格。
- 数据可索引对象,可选
如果给定,所有参数也接受一个字符串
s
,它被解释为data[s]
(除非这引发异常)。
也可以看看
violinplot
绘制概率密度函数的估计值。