统计 - 假设检验
假设检验是一种正式的方法,用于检查关于某个总体的假设是否真实。
假设检验
假设是对总体参数的声称。
假设检验是一种正式程序,用于检查假设是否真实。
可检验声称的示例
丹麦人的平均身高高于 170 厘米。
澳大利亚左撇子人的比例不是 10%。
牙医的平均收入低于律师的平均收入。
原假设和备择假设
假设检验基于对总体参数提出两个不同的声称。
原假设 (\(H_{0} \)) 和备择假设 (\(H_{1}\)) 是这些声称。
这两个声称必须互斥,这意味着只有一个声称可以为真。
备择假设通常是我们试图证明的。
例如,我们要检查以下声称
“丹麦人的平均身高高于 170 厘米。”
在这种情况下,参数是丹麦人的平均身高 (\(\mu\))。
原假设和备择假设将是
原假设:丹麦人的平均身高是 170 厘米。
备择假设:丹麦人的平均身高高于 170 厘米。
这些声称通常用符号表示,如下所示
\(H_{0}\): \(\mu = 170 \: cm \)
\(H_{1}\): \(\mu > 170 \: cm \)
如果数据支持备择假设,我们拒绝零假设并接受备择假设。
如果数据不支持备择假设,我们则保留原假设。
注意:备择假设也称为 (\(H_{A} \))。
显著性水平
显著性水平 (\(\alpha\)) 是我们在假设检验中拒绝原假设时所接受的不确定性。
显著性水平是意外做出错误结论的百分比概率。
典型的显著性水平是
- \(\alpha = 0.1\) (10%)
- \(\alpha = 0.05\) (5%)
- \(\alpha = 0.01\) (1%)
较低的显著性水平意味着数据中的证据需要更强才能拒绝零假设。
没有“正确”的显著性水平——它只说明了结论的不确定性。
注意:5% 的显著性水平意味着当我们拒绝一个零假设时
我们预计在 100 次中会拒绝 5 次真实的零假设。
检验统计量
检验统计量用于决定假设检验的结果。
检验统计量是根据样本计算出的标准化值。
标准化是指将统计量转换为一个众所周知的概率分布。
概率分布的类型取决于检验的类型。
常见的例子是
注意:您将在接下来的章节中学习如何计算每种类型检验的检验统计量。
临界值和 P 值方法
假设检验主要有两种方法
- 临界值方法将检验统计量与显著性水平的临界值进行比较。
- P 值方法将检验统计量的 P 值与显著性水平进行比较。
临界值方法
临界值方法检查检验统计量是否在拒绝域内。
拒绝域是分布尾部的概率区域。
拒绝域的大小由显著性水平 (\(\alpha\)) 决定。
分隔拒绝域与其他区域的值称为临界值。
以下是图形说明
如果检验统计量在此拒绝域内,则拒绝原假设。
例如,如果检验统计量为 2.3,临界值为 2,显著性水平为 (\(\alpha = 0.05\))
我们在 0.05 的显著性水平 (\(\alpha\)) 下拒绝原假设 (\(H_{0} \))。
P 值方法
P 值方法检查检验统计量的 P 值是否小于显著性水平 (\(\alpha\))。
检验统计量的 P 值是分布尾部从检验统计量值开始的概率区域。
以下是图形说明
如果 P 值小于显著性水平,则拒绝原假设。
P 值直接告诉我们最低显著性水平,在该水平下我们可以拒绝原假设。
例如,如果 P 值为 0.03
我们在 0.05 的显著性水平 (\(\alpha\)) 下拒绝原假设 (\(H_{0} \))。
我们在 0.01 的显著性水平 (\(\alpha\)) 下保留原假设 (\(H_{0}\))。
注意:这两种方法只是在呈现结论的方式上有所不同。
假设检验步骤
假设检验使用以下步骤
- 检查条件
- 定义断言
- 确定显著性水平
- 计算检验统计量
- 结论
一个条件是样本是随机抽取自总体的。
其他条件取决于您要检验假设的参数类型。
用于检验假设的常见参数有
- 比例(定性数据)
- 均值(数值数据)
您将在接下来的页面中学习这两种类型的步骤。