统计 - 四分位距
四分位距(Interquartile Range)是衡量数据离散程度的一种方法,它描述了数据的散布范围。
四分位距
四分位距是第一个和第三个 四分位数(Q1 和 Q3)之间的差值。
数据的“中间一半”位于第一个和第三个四分位数之间。
第一个四分位数是数据中将底部 25% 的值与顶部 75% 的值分开的值。
第三个四分位数是数据中将底部 75% 的值与顶部 25% 的值分开的值。
这是一张诺贝尔奖获得者(截至 2020 年)年龄的直方图,展示了 **四分位距 (IQR)**。
在这里,中间一半的年龄在 51 岁到 69 岁之间。因此,诺贝尔奖获得者的四分位距是 18 岁。
使用编程计算四分位距
许多编程语言都可以轻松计算四分位距。
使用软件和编程来计算统计数据在处理大型数据集时更为常见,因为手动计算会变得困难。
示例
使用 Python,可以通过 SciPy 库的 iqr()
方法计算值 13, 21, 21, 40, 42, 48, 55, 72 的四分位距。
from scipy import stats
values = [13,21,21,40,42,48,55,72]
x = stats.iqr(values)
print(x)
自己动手试一试 »
示例
使用 R 的 IQR()
函数计算值 13, 21, 21, 40, 42, 48, 55, 72 的四分位距。
values <- c(13,21,21,40,42,48,55,72)
IQR(values)
自己动手试一试 »