统计学 - 标准正态分布
标准正态分布是一个正态分布,其中均值为 0,标准差为 1。
标准正态分布
正态分布的数据可以转换为标准正态分布。
标准化正态分布数据使比较不同数据集变得更容易。
标准正态分布用于
- 计算置信区间
- 假设检验
以下是标准正态分布的图表,显示了标准差之间的概率值 (p 值)
标准化使计算概率变得更容易。
计算概率的函数很复杂,很难手动计算。
通常,概率是通过查找预先计算的值表或使用软件和编程来找到的。
标准正态分布也称为“Z 分布”,其值称为“Z 值”(或 Z 分数)。
Z 值
Z 值表示某个值距均值多少个标准差。
计算 Z 值的公式为
\(\displaystyle Z = \frac{x-\mu}{\sigma}\)
\(x\) 是我们要标准化的值,\(\mu\) 是均值,\(\sigma\) 是标准差。
例如,如果我们知道
德国人的平均身高为 170 厘米 (\(\mu\))
德国人身高的标准差为 10 厘米 (\(\sigma\))
鲍勃的身高为 200 厘米 (\(x\))
鲍勃比德国人的平均身高高 30 厘米。
30 厘米是 10 厘米的 3 倍。因此鲍勃的身高比德国人的平均身高高 3 个标准差。
使用公式
\(\displaystyle Z = \frac{x-\mu}{\sigma} = \frac{200-170}{10} = \frac{30}{10} = \underline{3} \)
鲍勃身高 (200 厘米) 的 Z 值为 3。
查找 Z 值的 P 值
使用Z 表或编程,我们可以计算出德国有多少人比鲍勃矮,有多少人比鲍勃高。
示例
使用 Python 的 Scipy Stats 库 norm.cdf()
函数查找 Z 值小于 3 的概率
import scipy.stats as stats
print(stats.norm.cdf(3))
自己试一试 »
使用任一方法,我们可以发现概率为 \(\approx 0.9987\),或 \( 99.87\% \)
这意味着鲍勃比德国 99.87% 的人高。
以下是标准正态分布和 Z 值为 3 的图表,用于可视化概率
这些方法可以找到我们所拥有的特定 z 值的 p 值。
要查找 z 值以上的 p 值,我们可以计算 1 减去概率。
因此在鲍勃的例子中,我们可以计算 1 - 0.9987 = 0.0013,或 0.13%。
这意味着只有 0.13% 的德国人比鲍勃高。
查找 Z 值之间的 P 值
如果我们想知道在同一个例子中,德国有多少人的身高在 155 厘米和 165 厘米之间
德国人的平均身高为 170 厘米 (\(\mu\))
德国人身高的标准差为 10 厘米 (\(\sigma\))
现在我们需要计算 155 厘米和 165 厘米的 Z 值
\(\displaystyle Z = \frac{x-\mu}{\sigma} = \frac{155-170}{10} = \frac{-15}{10} = \underline{-1.5} \)
155 厘米的 Z 值为 -1.5
\(\displaystyle Z = \frac{x-\mu}{\sigma} = \frac{165-170}{10} = \frac{-5}{10} = \underline{-0.5} \)
165 厘米的 Z 值为 -0.5
使用Z 表或编程,我们可以找到这两个 z 值的 p 值
- Z 值小于 -0.5(身高小于 165 厘米)的概率为 30.85%
- Z 值小于 -1.5(身高小于 155 厘米)的概率为 6.68%
从 30.85% 中减去 6.68% 以找到获得介于两者之间的 z 值的概率。
30.85% - 6.68% = 24.17%
以下是一组图表,说明了该过程
查找 P 值的 Z 值
你也可以使用 p 值(概率)来查找 z 值。
例如
“如果你比 90% 的德国人高,你的身高是多少?”
p 值为 0.9,或 90%。
使用Z 表或编程,我们可以计算出 z 值
示例
使用 Python 的 Scipy Stats 库 norm.ppf()
函数查找将前 10% 与后 90% 分开的 z 值
import scipy.stats as stats
print(stats.norm.ppf(0.9))
自己试一试 »
使用任一方法,我们可以发现 Z 值为 \(\approx 1.281\)
这意味着比德国人的平均身高高 1.281 个标准差的人比德国 90% 的人高。
然后我们使用公式根据德国人的平均身高 (\(\mu\)) 170 厘米和标准差 (\(\sigma\)) 10 厘米来计算身高 (\(x\))
\(\displaystyle Z = \frac{x-\mu}{\sigma} \)
\(\displaystyle 1.281 = \frac{x-170}{10} \)
\(1.281 \cdot 10 = x-170 \)
\(12.81 = x - 170 \)
\(12.81 + 170 = x \)
\(\underline{182.81} = x \)
因此,我们可以得出结论
“你必须至少 182.81 厘米高才能比 90% 的德国人高”