统计 - 估计
点估计是总体参数最有可能的值。
置信区间表示估计的总体参数的不确定性。
点估计
点估计是根据样本计算得出的。
点估计取决于数据的类型
- 分类数据:出现次数除以样本量。
- 数值数据:样本的平均值(平均值)。
举个例子
丹麦人平均身高点估计为 180 厘米。
估计总是不确定的。这种不确定性可以用置信区间表示。
置信区间
置信区间由下限和上限定义。
这给了我们一个范围,在这个范围内,真实的参数很可能处于其中。
例如
丹麦人平均身高在 170 厘米到 190 厘米之间。
这里,170 厘米是下限,190 厘米是上限。
置信区间的上下限基于置信水平。
置信水平
置信水平可以用百分比或小数表示,最常用的有
- 90% (0.90)
- 95% (0.95)
- 99% (0.99)
置信水平越高,区间越大。
例如,丹麦人平均身高的置信区间可能为
90% 置信水平:介于 175 厘米到 185 厘米之间。
95% 置信水平:介于 170 厘米到 190 厘米之间。
99% 置信水平:介于 160 厘米到 200 厘米之间。
我们将此置信水平与概率分布一起使用来确定误差范围有多大。
误差范围
误差范围是点估计与上下限之间的距离。
误差范围基于置信水平和我们从样本中获得的数据。
例如,如果丹麦人平均身高的点估计为 180 厘米
5 厘米误差范围:介于 175 厘米到 185 厘米之间。
10 厘米误差范围:介于 170 厘米到 190 厘米之间。
20 厘米误差范围:介于 160 厘米到 200 厘米之间。
计算置信区间的步骤
以下步骤用于计算置信区间
- 检查条件
- 找到点估计
- 确定置信水平
- 计算误差范围
- 计算置信区间
一个条件是样本是从总体中随机抽取的。
其他条件取决于您计算置信区间的参数类型。
常见的估计参数有
- 比例(用于定性数据)
- 平均值(用于数值数据)
您将在以下页面中学习这两种类型的步骤。