统计学 - 平均数
平均数是一种平均值类型,描述了数据中心的所在位置。
平均值
平均值通常被称为“平均数”。
平均值是数据中所有值的总和除以数据中值的总数。
平均值是针对数值变量计算的。变量是数据中可以变化的东西,例如
- 年龄
- 身高
- 收入
注意:平均值有多种类型。最常见的平均值类型是算术平均数。
在本教程中,“平均数”指的是算术平均数。
计算平均值
您可以针对总体和样本计算平均值。
公式相同,并使用不同的符号来指代总体均值(\(\mu\))和样本均值(\(\bar{x}\))。
计算总体均值(\(\mu\))使用以下公式
\(\displaystyle \mu = \frac{\sum x_{i}}{n}\)
计算样本均值(\(\bar{x}\))使用以下公式
\(\displaystyle \bar{x} = \frac{\sum x_{i}}{n}\)
分数的底部部分(\(n\))是观察值的总数。
\(\sum \)是将数字列表加在一起的符号。
\(x_{i}\)是数据中的值列表:\(x_{1}, x_{2}, x_{3}, \ldots \)
分数的顶部部分(\(\sum x_{i}\))是\(x_{1}, x_{2}, x_{3}, \ldots \)加在一起的总和。
因此,如果一个样本有4个观察值,其值为:4、11、7、14,则计算结果为
\(\displaystyle \bar{x} = \frac{4 + 11 + 7 + 14}{4} = \frac{36}{4} = \underline{9} \)
使用编程计算
许多编程语言都可以轻松地计算平均值。
对于较大的数据集,使用软件和编程来计算统计数据更为常见,因为手动计算变得困难。
示例
使用 Python 的 NumPy 库 mean()
方法查找值 4、11、7、14 的平均值
import numpy
values = [4,11,7,14]
x = numpy.mean(values)
print(x)
自己试试 »
示例
统计学符号参考
符号 | 描述 |
---|---|
\( \mu \) | 总体均值。读作“缪”。 |
\( \bar{x} \) | 样本均值。读作“x拔”。 |
\( \sum \) | 求和运算符,“大写西格玛”。 |
\( x \) | 我们正在计算平均值的变量“x”。 |
\( i \) | 变量“x”的索引“i”。这标识了变量的每个观察值。 |
\( n \) | 观察值的个数。 |