上QQ阅读APP看书,第一时间看更新
1.2.1 统计描述的关键技术
1.对数据集中性的描述
在统计分析过程中,人们通常需要了解数据序列中的数据会集中于哪一个数据点周围。该数据点是在统计分布上具有明显集中趋势的数值,代表数据序列的一般水平。常见的描述量主要有均值、中位数和众数等。
在统计中,均值、中位数是针对取值大小有意义的数据序列的集中性描述统计量,常用于身高、体重、长度等测量值;而众数主要用于描述取值大小无意义的数据序列的集中性,诸如民族、生源地等。
2.对数据离散性的描述
在统计分析中,人们通常需要了解数据序列在均值上下的波动程度,即对数据离散性的描述。数据在均值附近的波动性大小是序列的重要属性之一。衡量数据序列离散性的描述统计量主要有方差、标准差和异众比率。
在统计中,对于取值大小有意义的数据序列,人们通常以方差或标准差来描述其离散性;对于取值大小无意义的数据序列,则以异众比率描述其离散程度。异众比率指非众数组的个案在总体内所占的比重。
3.对数据分布形态的描述
数据的分布形态对分析方法的选择具有重要影响。因此,在描述数据时,阐明数据的分布形态也非常重要。在统计学中,数据的分布形态主要有正态分布、均匀分布、指数分布、泊松分布等。另外,偏度和峰度也是描述数据分布形态的重要指标。