统计学 - 四分位数和百分位数
四分位数和百分位数是变异的度量,描述了数据的离散程度。
四分位数和百分位数都是分位数的类型。
四分位数
四分位数是将数据分成四个相等部分的值。
以下直方图显示了截至 2020 年所有 934 位诺贝尔奖获得者的年龄,并显示了四分位数
四分位数(Q0,Q1,Q2,Q3,Q4)是将每个四分位数分隔开的值。
Q0 和 Q1 之间是数据中 25% 的最低值。Q1 和 Q2 之间是接下来的 25%。依此类推。
- Q0 是数据中最小的值。
- Q1 是将数据第一个四分位数与第二个四分位数分隔开的值。
- Q2 是中间值(中位数),将数据下半部分与上半部分分隔开。
- Q3 是将数据第三个四分位数与第四个四分位数分隔开的值
- Q4 是数据中最大的值。
用编程计算四分位数
许多编程语言都可以轻松找到四分位数。
对于更大的数据集,使用软件和编程来计算统计数据更为常见,因为手动查找变得困难。
示例
在 Python 中使用 NumPy 库的 quantile()
方法找到值 13、21、21、40、42、48、55、72 的四分位数
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.quantile(values, [0,0.25,0.5,0.75,1])
print(x)
自己尝试 »
示例
使用 R 的 quantile()
函数找到值 13、21、21、40、42、48、55、72 的分位数
values <- c(13,21,21,40,42,48,55,72)
quantile(values)
自己尝试 »
百分位数
百分位数是将数据分成 100 个相等部分的值。
例如,第 95 个百分位数将数据中最低的 95% 的值与最高的 5% 的值分隔开。
第 25 个百分位数 (P25%) 等于第一个四分位数 (Q1)。
第 50 个百分位数 (P50%) 等于第二个四分位数 (Q2) 和中位数。
第 75 个百分位数 (P75%) 等于第三个四分位数 (Q3)
用编程计算百分位数
许多编程语言都可以轻松找到百分位数。
对于更大的数据集,使用软件和编程来计算统计数据更为常见,因为手动查找变得困难。
示例
在 Python 中使用 NumPy 库的 percentile()
方法找到值 13、21、21、40、42、48、55、72 的 65
个百分位数
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.percentile(values, 65)
print(x)
自己尝试 »
示例
使用 R 的 quantile()
函数找到值 13、21、21、40、42、48、55、72 的第 65 个百分位数 (0.65
)
values <- c(13,21,21,40,42,48,55,72)
quantile(values, 0.65)
自己尝试 »