性的描述( 三 )


文章插图
中间黑色出现是各区域中游水平的房价标准(中位数);x是全区域的平均房价水平(平均值);箱型上端代表中上游水平;箱型下端代表中下游水平,以此类推 。简而言之,房价分布被四等分了 。
我们来解读一下:朝阳区的房价分布范围较广,高低值差异较大,可能和横跨多环有关,整体平均水平位于四区域前列 。海淀区平均房价次之,但也不低 。丰台区房价分布较为集中且偏态较小,跨度相对较小 。通州区很明显整体房价最低 。
这张图能一眼看出不少内容,想必大家已经明白箱线图的作用了,它能读出数据的整体分布和倾斜趋势(偏态) 。
到这里,描述统计的内容就结束了 。描述统计是分析数据的一种技巧,包含数据的集中度量(平均数、中位数、众数)、数据的离散(方差、标准差)、数据的分布(箱线图、条形图、直方图)三块 。
此文是《10周入门数据分析》系列的第8篇 。
想了解学习路线,可以前往公众号先行阅读“ 学习计划 | 10周入门数据分析
文章中Excel 2016 及数据,公众号后台回复【描述统计】即可获得下载!

经验总结扩展阅读