跳转到内容

英文维基 | 中文维基 | 日文维基 | 草榴社区

集中趋势

维基百科,自由的百科全书

在统计学中,集中趋势(central tendency)或中央趋势,在口语上也经常被称为平均,表示一个机率分布的中间值[1]。最常见的几种集中趋势包括算数平均数中位数众数。集中趋势可以由有限的数组(如一群样本)中或理论上的机率分配(如常态分布)中求得。有些人使用集中趋势(或集中性)这个词以表示“数量化的资料之中央值的趋势”[2][3]。在这种意义下,我们可以利用资数据离散程度(例如标准偏差四分差等相似的统计量)判别其集中趋势的程度。

集中趋势(central tendency)一词于1920年代后期出现[3]

集中趋势的统计量

[编辑]

一维资料的集中趋势可能有以下数种统计方法。在某些情况下,经转型英语Data transformation (statistics)data transformation)后的资料才采用以下的方法。

算术平均数
观测值的总和除以观测值的个数,即。常简称为平均数,也往往是背后机率分布的期望值之不偏估计。
中位数
将所有观测值按大小排序后在顺序上居中的数值。
众数
出现最多次的观测值。
几何平均数
观测值的乘积之观测值个数方根,即
调和平均数
观测值个数除以观测值倒数的总和,即
加权平均数
考虑不同群资料贡献程度不同时的算数平均数
截尾平均数truncated mean
忽略特定比例或特定数值之外的极端值后所得的平均数。例如,四分平均数英语Interquartile_meaninterquartile mean)正是忽略25%前及75%后的资料后所得的算数平均数。
中程数英语Midrangemidrange)又称全距中值[4]
最大值与最小值的算数平均数,即
中枢纽英语Midhingemidhinge
第一四分位数与第三四分位数的算数平均数,即
三均值trimean
考虑三个四分位数的加权平均数,即
极端值调整平均数英语Winsorized_meanwinsorized mean
以最接近的观测值取代特定比例的极端值后取得的算数平均数。举例来说,考虑10个观测值(由小到大排列为)的情况下,10%的极端值调整平均数为
其中分别以取代了

以上的统计量在多维变数中仍可单独地被套用在各个维度上进行,但并不能保证在转轴后仍维持一致的结果。

平均数、中位数与众数的关系

[编辑]
在指数分配exp(λ)中,期望值为1/λ而中位数为(ln 2)/λ,二者并不一致。

在左右对称的机率分布中,不同的集中趋势统计量有相同结果,但在偏度远离0时则可能不一致。在单峰型的机率分布(unimodal probability distribution)中,平均数(μ)、中位数(ν)与众数(θ)的关系如下:[5]

其中σ标准偏差。至于任一机率分布,[6][7]

参考文献

[编辑]
  1. ^ Weisberg, H. F. (1992) Central Tendency and Variability, Sage University Paper Series on Quantitative Applications in the Social Sciences, ISBN 0-8039-4007-6 p. 2.
  2. ^ Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms, OUP for International Statistical Institute. ISBN 0-19-920613-9 (entry for "central tendency")
  3. ^ 3.0 3.1 Upton, G.; Cook, I. (2008) Oxford Dictionary of Statistics, OUP ISBN 978-0-19-954145-4 (entry for "central tendency")
  4. ^ 中程數 mid-range. [2019-12-03]. (原始内容存档于2019-12-03). 
  5. ^ Johnson NL, Rogers CA (1951) "The moment problem for unimodal distributions". Annals of Mathematical Statistics, 22 (3) 433–439
  6. ^ Hotelling H, Solomons LM (1932) The limits of a measure of skewness. Annals Math Stat 3, 141–114
  7. ^ Garver (1932) Concerning the limits of a mesuare of skewness. Ann Math Stats 3(4) 141–142