菜单
×
   ❮     
HTML CSS JAVASCRIPT SQL PYTHON JAVA PHP HOW TO W3.CSS C C++ C# BOOTSTRAP REACT MYSQL JQUERY EXCEL XML DJANGO NUMPY PANDAS NODEJS R TYPESCRIPT ANGULAR GIT POSTGRESQL MONGODB ASP AI GO KOTLIN SASS VUE DSA GEN AI SCIPY AWS CYBERSECURITY DATA SCIENCE
     ❯   

数据科学 - 统计方差


方差

方差是另一个表示数值离散程度的数字。

事实上,如果你取方差的平方根,你就会得到标准差。反之亦然,如果你将标准差乘以它本身,你就会得到方差!

我们先用包含 10 个观测值的数据集举例说明如何计算方差

持续时间 Average_Pulse Max_Pulse Calorie_Burnage Hours_Work Hours_Sleep
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

提示: 方差通常用符号“西格玛平方”表示:σ^2


计算方差的步骤 1:求平均值

我们要计算 Average_Pulse 的方差。

1. 求平均值

(80+85+90+95+100+105+110+115+120+125) / 10 = 102.5

平均值是 102.5


步骤 2:计算每个值与平均值的差值

2. 计算每个值与平均值的差值

80 - 102.5 = -22.5
85 - 102.5 = -17.5
90 - 102.5 = -12.5
95 - 102.5 = -7.5
100 - 102.5 = -2.5
105 - 102.5 = 2.5
110 - 102.5 = 7.5
115 - 102.5 = 12.5
120 - 102.5 = 17.5
125 - 102.5 = 22.5

步骤 3:计算每个差值的平方值

3. 计算每个差值的平方值

(-22.5)^2 = 506.25
(-17.5)^2 = 306.25
(-12.5)^2 = 156.25
(-7.5)^2 = 56.25
(-2.5)^2 = 6.25
2.5^2 = 6.25
7.5^2 = 56.25
12.5^2 = 156.25
17.5^2 = 306.25
22.5^2 = 506.25

注意: 我们必须对值进行平方才能得到总的离散程度。



步骤 4:方差是这些平方值的平均数

4. 将平方值相加并求平均值

(506.25 + 306.25 + 156.25 + 56.25 + 6.25 + 6.25 + 56.25 + 156.25 + 306.25 + 506.25) / 10 = 206.25

方差是 206.25。


使用 Python 计算 health_data 的方差

我们可以使用 Numpy 的 var() 函数来计算方差(请记住,我们现在使用的是包含 10 个观测值的第一数据集)

示例

import numpy as np

var = np.var(health_data)
print(var)
自己动手试一试 »

输出结果

Variance

使用 Python 计算完整数据集的方差

这里我们计算完整数据集每一列的方差

示例

import numpy as np

var_full = np.var(full_health_data)
print(var_full)
自己动手试一试 »

输出结果

Variance

×

联系销售

如果您想将 W3Schools 服务用于教育机构、团队或企业,请发送电子邮件给我们
sales@w3schools.com

报告错误

如果您想报告错误,或想提出建议,请发送电子邮件给我们
help@w3schools.com

W3Schools 经过优化,旨在方便学习和培训。示例可能经过简化,以提高阅读和学习体验。教程、参考资料和示例会不断审查,以避免错误,但我们无法保证所有内容的完全正确性。使用 W3Schools 即表示您已阅读并接受我们的使用条款Cookie 和隐私政策

版权所有 1999-2024 Refsnes Data。保留所有权利。W3Schools 由 W3.CSS 提供支持