数据科学 - 统计标准差
标准差
标准差是一个描述观察值分散程度的数值。
如果观察值“分散”,数学函数将难以预测精确值。标准差是衡量不确定性的指标。
标准差较低意味着大多数数值接近平均值。
标准差较高意味着数值分散在较宽的范围内。
提示:标准差通常用符号 Sigma 表示:σ
我们可以使用 Numpy 中的 std()
函数来查找变量的标准差
输出结果
这些数字意味着什么?
变异系数
变异系数用于了解标准差的大小。
从数学上讲,变异系数定义为
变异系数 = 标准差 / 平均值
如果我们使用以下代码,可以在 Python 中进行此操作
输出结果
我们可以看到,与 Max_Pulse、Average_Pulse 和 Hours_Sleep 相比,变量 Duration、Calorie_Burnage 和 Hours_Work 具有较高的标准差。