分布
- 什么是正态分布?
- 什么是误差范围?
- 什么是偏度?
- 什么是峰度?
正态分布
正态分布曲线呈钟形。
曲线的每个区间宽度为1 个标准差
曲线的每个区间宽度为平均值的 1 个标准差。
小于1 个标准差的数值占68.27%。
小于2 个标准差的数值占95.45%。
小于3 个标准差的数值占99.73%。
这意味着什么?
大多数观测值在平均值的 1 个标准差内。
几乎所有观测值都在 2 个标准差内。
实际上所有观测值都在 3 个标准差内。
正态分布的事实
正态分布是对称的。峰值始终将分布分成两半。
正态分布是一种概率分布。
许多观测值遵循正态分布
- 你的智商
- 你的体重
- 你的身高
- 你的薪水
- 你的血压
正态分布表明,接近平均值的数值比远离平均值的数值更常见
距平均值的距离 | 人口百分比 |
---|---|
1 个标准差 | 68.27% |
2 个标准差 | 95.45% |
3 个标准差 | 99.73% |
68-95-99.7 法则(也称为经验法则)是一种速记方法,用于记住位于正态分布不同区间内的数值的百分比。
正态分布也称为高斯分布和钟形曲线。
误差范围
统计学家总是试图以 100% 的准确度预测一切。
但是,总会存在一些不确定性。
误差范围是量化这种统计不确定性的数字。
不同的误差范围定义了我们认为正确答案可能位于的不同范围。
可接受的误差范围是判断问题,并且与答案的重要性相关。
我们收集的样本越多,误差范围越小
如何解读误差范围
假设 55% 的样本人群表示他们计划投票“赞成”。
在将其投射到整个人群时,您添加/减去误差范围以提供可能的范围结果。
误差范围为 3%,您有信心 52% 到 58% 的人会投票“赞成”。
误差范围为 10%,您有信心 45% 到 65% 的人会投票“赞成”。
偏度
偏度是钟形曲线(正态分布)的失真(不对称)。
峰度
峰度也是正态分布(钟形曲线)的失真。
偏度描述的是一条尾部中的意外值,而峰度描述的是两条尾部中的意外值。
图片:负峰度(低于正态分布)。
图片:正峰度(高于正态分布)。