统计学 - 假设检验
假设检验是一种正式的方法,用于检查关于总体的假设是否正确。
假设检验
一个假设是对总体参数的断言。
一个假设检验是一种正式的程序,用于检查假设是否正确。
可以检查的断言示例
丹麦人的平均身高超过170厘米。
澳大利亚左撇子的比例不是10%。
牙医的平均收入低于律师的平均收入。
零假设和备择假设
假设检验基于对总体参数做出两个不同的断言。
零假设(\(H_{0} \))和备择假设(\(H_{1}\))是这些断言。
这两个断言需要是互斥的,意味着它们中只有一个可以为真。
备择假设通常是我们试图证明的。
例如,我们要检查以下断言
"丹麦人的平均身高超过170厘米。"
在这种情况下,参数是丹麦人的平均身高(\(\mu\))。
零假设和备择假设将是
零假设:丹麦人的平均身高是170厘米。
备择假设:丹麦人的平均身高超过170厘米。
这些断言通常用以下符号表示
\(H_{0}\): \(\mu = 170 \: cm \)
\(H_{1}\): \(\mu > 170 \: cm \)
如果数据支持备择假设,我们拒绝零假设并接受备择假设。
如果数据不支持备择假设,我们保留零假设。
注意:备择假设也被称为(\(H_{A} \))。
显著性水平
显著性水平(\(\alpha\))是我们在假设检验中拒绝零假设时接受的不确定性。
显著性水平是意外得出错误结论的百分比概率。
典型的显著性水平是
- \(\alpha = 0.1\) (10%)
- \(\alpha = 0.05\) (5%)
- \(\alpha = 0.01\) (1%)
较低的显著性水平意味着数据中的证据需要更强才能拒绝零假设。
没有“正确”的显著性水平 - 它只说明结论的不确定性。
注意:5% 的显著性水平意味着当我们拒绝一个零假设时
我们预计每 100 次会拒绝一个正确的零假设 5 次。
检验统计量
检验统计量用于决定假设检验的结果。
检验统计量是一个标准化的值,它是根据样本计算出来的。
标准化意味着将统计量转换为一个众所周知的概率分布。
概率分布的类型取决于检验的类型。
常见的例子是
注意:您将在以下章节中学习如何计算每种检验类型的检验统计量。
临界值和P值方法
假设检验主要采用两种方法
- 临界值方法将检验统计量与显著性水平的临界值进行比较。
- P值方法将检验统计量的P值与显著性水平进行比较。
临界值方法
临界值方法检查检验统计量是否在拒绝域内。
拒绝域是分布尾部的概率区域。
拒绝域的大小由显著性水平(\(\alpha\))决定。
将拒绝域与其他区域分隔开的值称为临界值。
以下是一个图形说明
如果检验统计量在这个拒绝域内,则拒绝零假设。
例如,如果检验统计量为2.3,而对于显著性水平(\(\alpha = 0.05\))的临界值为2
我们在0.05的显著性水平(\(\alpha\))下拒绝零假设(\(H_{0} \))。
P值方法
P值方法检查检验统计量的P值是否小于显著性水平(\(\alpha\))。
检验统计量的P值是分布尾部从检验统计量值开始的概率区域。
以下是一个图形说明
如果P值小于显著性水平,则拒绝零假设。
P值直接告诉我们最低的显著性水平,在这个水平上我们可以拒绝零假设。
例如,如果P值为0.03
我们在0.05的显著性水平(\(\alpha\))下拒绝零假设(\(H_{0} \))。
我们在0.01的显著性水平(\(\alpha\))下保留零假设(\(H_{0}\))。
注意:这两种方法只是在如何呈现结论方面有所不同。
假设检验步骤
假设检验使用以下步骤
- 检查条件
- 定义断言
- 决定显著性水平
- 计算检验统计量
- 结论
一个条件是样本是从总体中随机抽取的。
其他条件取决于您正在检验假设的参数类型。
检验假设的常见参数是
- 比例(对于定性数据)
- 均值(对于数值数据)
您将在以下页面中学习这两种类型的步骤。