统计 - 中位数
中位数是一种平均值,用来描述数据中心的定位。
中位数
中位数是按从低到高排序的数据集中**中间**的值。
计算中位数
中位数只能针对数值型变量进行计算。
计算中间值的方法是:
\( \displaystyle \frac{n + 1}{2} \)
其中 \(n\) 是观察值的总数。
如果观察值的总数为**奇数**,则公式会得到一个整数,这个整数对应的观察值即为中位数。
13, 21, 21, 40, 48, 55, 72
此处共有 7 个观察值,因此中位数是第 4 个值:
\( \displaystyle \frac{7 + 1}{2} = \frac{8}{2} = 4 \)
排序列表中的第 4 个值为 **40**,所以 40 是中位数。
如果观察值的总数为**偶数**,则公式会得到一个介于两个观察值之间的十进制数。
13, 21, 21, 40, 42, 48, 55, 72
此处共有 8 个观察值,因此中位数介于第 4 个和第 5 个值之间:
\( \displaystyle \frac{8 + 1}{2} = \frac{9}{2} = 4.5 \)
排序列表中的第 4 个和第 5 个值分别是 **40** 和 **42**,因此中位数是这两个值的**平均值**。即这两个值之和除以 2:
\( \displaystyle \frac{40+42}{2} = \frac{82}{2} = \underline{41} \)
注意:在计算中位数之前,务必对数字进行排序。
使用编程计算中位数
使用许多编程语言可以轻松计算中位数。
使用软件和编程来计算统计数据在处理大型数据集时更为常见,因为手动计算会变得困难。
示例
使用 Python 的 NumPy 库,使用 median()
方法来计算值 13, 21, 21, 40, 42, 48, 55, 72 的中位数:
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.median(values)
print(x)
自己动手试一试 »
示例
使用 R 的 median()
函数来计算值 13, 21, 21, 40, 42, 48, 55, 72 的中位数:
values <- c(13,21,21,40,42,48,55,72)
median(values)
自己动手试一试 »