统计 - 标准正态分布
标准正态分布是指均值为 0,标准差为 1 的正态分布。
标准正态分布
服从正态分布的数据可以转换为标准正态分布。
对服从正态分布的数据进行标准化处理,可以更容易地比较不同的数据集。
标准正态分布用于
- 计算置信区间
- 假设检验
下图是标准正态分布的图形,其中标示了标准差之间的概率值(p 值)。
标准化处理可以更容易地计算概率。
计算概率的函数非常复杂,难以手动计算。
通常,概率是通过查找预先计算值的表格,或使用软件和程序来找到的。
标准正态分布也称为“Z 分布”,其值称为“Z 值”(或 Z 分数)。
Z 值
Z 值表示一个值距离均值有多少个标准差。
计算 Z 值的公式是:
\(\displaystyle Z = \frac{x-\mu}{\sigma}\)
其中 \(x\) 是要标准化的值,\(\mu\) 是均值,\(\sigma\) 是标准差。
例如,如果我们知道:
德国人平均身高为 170 厘米(\(\mu\))
德国人身高的标准差为 10 厘米(\(\sigma\))
鲍勃的身高为 200 厘米(\(x\))
鲍勃比德国人的平均身高高 30 厘米。
30 厘米是 10 厘米的 3 倍。所以鲍勃的身高比德国平均身高高 3 个标准差。
使用公式:
\(\displaystyle Z = \frac{x-\mu}{\sigma} = \frac{200-170}{10} = \frac{30}{10} = \underline{3} \)
鲍勃身高(200 厘米)的 Z 值为 3。
查找 Z 值的 P 值
使用 Z 表或编程,我们可以计算德国有多少人比鲍勃矮,有多少人比鲍勃高。
示例
使用 Python,可以使用 Scipy Stats 库的 norm.cdf()
函数找到 Z 值为 3 的概率(即小于 Z 值为 3 的概率)。
import scipy.stats as stats
print(stats.norm.cdf(3))
自己动手试一试 »
使用任何一种方法,我们都可以发现概率约为 \(\approx 0.9987\),即 \( 99.87\% \)。
这意味着鲍勃比 99.87% 的德国人高。
下图是标准正态分布和 Z 值为 3 的图形,以可视化概率。
这些方法找到的是特定 z 值以下的 p 值。
要找到 z 值以上的 p 值,我们可以计算 1 减去该概率。
所以,在鲍勃的例子中,我们可以计算 1 - 0.9987 = 0.0013,即 0.13%。
这意味着只有 0.13% 的德国人比鲍勃高。
查找 Z 值之间的 P 值
如果我们想知道德国有多少人身高在 155 厘米到 165 厘米之间,使用相同的例子:
德国人平均身高为 170 厘米(\(\mu\))
德国人身高的标准差为 10 厘米(\(\sigma\))
现在我们需要计算 155 厘米和 165 厘米的 Z 值。
\(\displaystyle Z = \frac{x-\mu}{\sigma} = \frac{155-170}{10} = \frac{-15}{10} = \underline{-1.5} \)
155 厘米的 Z 值为 -1.5。
\(\displaystyle Z = \frac{x-\mu}{\sigma} = \frac{165-170}{10} = \frac{-5}{10} = \underline{-0.5} \)
165 厘米的 Z 值为 -0.5。
使用 Z 表或编程,我们可以找到两个 z 值的 p 值:
- Z 值小于 -0.5(身高小于 165 厘米)的概率为 30.85%。
- Z 值小于 -1.5(身高小于 155 厘米)的概率为 6.68%。
将 6.68% 从 30.85% 中减去,以找到它们之间的 Z 值的概率。
30.85% - 6.68% = 24.17%
这是一组图示化该过程的图形。
查找 P 值的 Z 值
您也可以使用 p 值(概率)来查找 z 值。
例如
“如果您比 90% 的德国人高,您的身高是多少?”
p 值为 0.9,即 90%。
使用 Z 表或编程,我们可以计算 z 值。
示例
使用 Python,可以使用 Scipy Stats 库的 norm.ppf()
函数找到将前 10% 与后 90% 分隔的 z 值。
import scipy.stats as stats
print(stats.norm.ppf(0.9))
自己动手试一试 »
使用任一方法,我们都可以发现 Z 值为 \(\approx 1.281\)。
这意味着一个比德国人平均身高高 1.281 个标准差的人比 90% 的德国人高。
然后我们使用公式根据均值(\(\mu\)) 为 170 厘米,标准差(\(\sigma\)) 为 10 厘米来计算身高(\(x\))。
\(\displaystyle Z = \frac{x-\mu}{\sigma} \)
\(\displaystyle 1.281 = \frac{x-170}{10} \)
\(1.281 \cdot 10 = x-170 \)
\(12.81 = x - 170 \)
\(12.81 + 170 = x \)
\(\underline{182.81} = x \)
因此,我们可以得出结论:
"您至少需要达到 182.81 厘米高,才能比 90% 的德国人高"