回复yvonnexigua 的信:
箱尾图
需要理解的几个英文单词:
median: 中数 ,箱子中间那条线
hinges: 75%-25%=IQ [IQ=interquatile range,SIQ=Semi-interquatile range =(75%-25% )/2 四分位距], 即箱子的一条边是75%位的数值,另一条边是25%位的数值,箱子的长度就是这两个数值间的距离.
H-spread : 就是指hinges的长度,即IQ=H
inner fence: 内墙, 即箱子两边的两道墙,箱子到这两到墙的距离都是1.5H,(从箱子的两边算起)
whiskers : 箱子的尾巴, 你会发现箱子的尾巴无限趋近但不会到达内墙,这是因为箱子尾巴长度的值,是这样取得的: 在原始数据中最靠近1.5H值的那个数.(左边的是大于1.5H并最靠近,右边是小于1.5H并无限靠近)
adjacent value : 最接近的数
outliers :极端值, 没有包含在内墙之内的数值就是极端值,用散点在墙外标记出来.
箱尾图也像均数和方差那样反映数据的集中趋势和离散趋势,不过它用的统计量是中数和四分位数,这对于两端有不确定的数据的样本的描述是非常有用的.
箱尾图也能反映是否偏态,即箱子中间那条线如果不在正中间,就是偏态的. |