众数、中位数和平均数是集中趋势的三个主要测度值,只是它们具有不同的特点和应用场合。
对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下数量关系:如果数据的分布时对称的,中位数、算术平均数、众数三者完全相等。
如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方偏移,而众数和中位数由于是位置代表值,不受极值的影响,因此三者之间的关系表现为:平均数<中位数<众数。
如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方偏移,则众数<中位数<平均数。
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数(或最中间位置的两个数的平均数)叫做这组数据的中位数。中位数的大小仅与数据的排列位置有关。因此中位数不受偏大和偏小数的影响,当一组数据中的个别数据变动较大时,常用它来描述这组数据的集中趋势。
众数:在一组数据中出现次数最多的数据叫做这组数据的众数。因此求一组数据的众数既不需要计算,也不需要排序,而只要数出出现次数较多的数据的频率就行了。众数与概率有密切的关系。众数的大小仅与一组数据中的部分数据有关。当一组数据中有不少数据多次重复出现时,它的众数也往往是我们关心的一种集中趋势。
平均数:一组数据,用这组数据的总和除以总分数,得出的数就是这组数据的平均数。平均数的大小与一组数据里的每个数据都有关系,任何一个数据的变动都会引起平均数的变动,即平均数受较大数和较小数的影响。