中位数还是能正确的描述出这批数据的整体收⼊⽔平,不会像平均值那样因为异常的数值产⽣变化。 查文红image.png
四分位数:
operators
image.png
龙军金属全国女排大奖赛整个数据集按从⼩到⼤排序,最⼩的数值位于最左边,叫做下界。最右边的数值位于最右边,叫做上界。中位数把数集分成两个50%,下四分位就是把前50%分成两个25%,上四分位就是把后50%,分成两个25%。
直接⾁眼看四分位数的5个数值是看不出什么东西的,为了⽅便⼈类⼤脑直观形象的理解四分位数,⽤于表⽰四分位数的箱线图被发明了。
image.png
jasperreport上界是22,但中位数离下四分位数较近,表明⼤部分数据集中盒⼦的下端,即⼤部分数据的值集中在下四分位数和中位数之间。中位数是资料的集中性描述,还是以这张图为例:
插花艺术论文
image.png
image.png
⼤部分⼈(4⼈)的收⼊⽔平在12万左右,⼈数集中在12万左右,只有马云(1⼈)收⼊10亿,也就是说看中位数(Q2)相当与看⼤多数⼈的⽔平,也就是看集中性,⽽结合了上下界就可以看出⼤部分⼈的⽔平是偏⾼还是偏低,Q1其实是⼀半⼈的中位数,根据Q1就可以看出这⼀半⼈的集 中⽔平是多少,是偏低还是偏⾼,Q3和Q1同理,看的是另⼀半⼈的集中⽔平。所以通过箱线图就可以看出数据的整体分布。