统计 - 中位数
中位数是一种平均值类型,它描述了数据的中心位置。
中位数
中位数是按从小到大排序的数据集中间的值。
求中位数
中位数只能针对数值变量计算。
求中间值的公式是
\( \displaystyle \frac{n + 1}{2} \)
其中 \(n\) 是观测值的总数。
如果观测值的总数是奇数,则公式将给出整数,该观测值的值就是中位数。
13, 21, 21, 40, 48, 55, 72
这里,总共有 7 个观测值,所以中位数是第 4 个值
\( \displaystyle \frac{7 + 1}{2} = \frac{8}{2} = 4 \)
排序列表中的第 4 个值是40,所以这就是中位数。
如果观测值的总数是偶数,则公式将给出两个观测值之间的十进制数。
13, 21, 21, 40, 42, 48, 55, 72
这里,总共有 8 个观测值,所以中位数介于第 4 个和第 5 个值之间
\( \displaystyle \frac{8 + 1}{2} = \frac{9}{2} = 4.5 \)
排序列表中的第 4 个和第 5 个值是40 和42,所以中位数是这两个值的平均值。也就是说,这两个值的和除以 2
\( \displaystyle \frac{40+42}{2} = \frac{82}{2} = \underline{41} \)
注意:在求中位数之前,重要的是对数字进行排序。
使用编程求中位数
许多编程语言都可以轻松求出中位数。
对于更大的数据集,使用软件和编程来计算统计数据更为常见,因为手动计算变得很困难。
示例
使用 Python 中的 NumPy 库的 median()
方法求出值 13、21、21、40、42、48、55、72 的中位数
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.median(values)
print(x)
自己试试 »
示例
使用 R 的 median()
函数求出值 13、21、21、40、42、48、55、72 的中位数
values <- c(13,21,21,40,42,48,55,72)
median(values)
自己试试 »