统计 - 四分位数和百分位数
四分位数和百分位数是变异性度量,用于描述数据的分散程度。
四分位数和百分位数都属于分位数。
四分位数
四分位数是将数据分成四等份的值。
这是截至 2020 年所有 934 位诺贝尔奖获得者年龄的直方图,显示了四分位数
四分位数(Q0、Q1、Q2、Q3、Q4)是分隔每个四分之一段的值。
Q0 和 Q1 之间是数据中最低的 25% 的值。Q1 和 Q2 之间是下一个 25%。以此类推。
- Q0 是数据中的最小值。
- Q1 是分隔数据第一象限和第二象限的值。
- Q2 是中间值(中位数),分隔下半部分和上半部分。
- Q3 是分隔第三象限和第四象限的值。
- Q4 是数据中的最大值。
使用编程计算四分位数
许多编程语言都可以轻松找到四分位数。
使用软件和编程来计算统计数据在处理大型数据集时更为常见,因为手动计算会变得困难。
示例
使用 Python 和 NumPy 库的 quantile()
方法可以找到值 13、21、21、40、42、48、55、72 的四分位数。
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.quantile(values, [0,0.25,0.5,0.75,1])
print(x)
自己动手试一试 »
示例
使用 R 的 quantile()
函数可以找到值 13、21、21、40、42、48、55、72 的分位数。
values <- c(13,21,21,40,42,48,55,72)
quantile(values)
自己动手试一试 »
百分位数
百分位数是将数据分成 100 等份的值。
例如,第 95 个百分位数将最低的 95% 的值与最高的 5% 的值分开。
第 25 个百分位数 (P25%) 与第一个四分位数 (Q1) 相同。
第 50 个百分位数 (P50%) 与第二个四分位数 (Q2) 和中位数相同。
第 75 个百分位数 (P75%) 与第三个四分位数 (Q3) 相同。
使用编程计算百分位数
许多编程语言都可以轻松找到百分位数。
使用软件和编程来计算统计数据在处理大型数据集时更为常见,因为手动计算会变得困难。
示例
使用 Python 和 NumPy 库的 percentile()
方法可以找到值 13、21、21、40、42、48、55、72 的第 65
个百分位数。
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.percentile(values, 65)
print(x)
自己动手试一试 »
示例
使用 R 的 quantile()
函数可以找到值 13、21、21、40、42、48、55、72 的第 65 个百分位数(0.65
)。
values <- c(13,21,21,40,42,48,55,72)
quantile(values, 0.65)
自己动手试一试 »