数据科学 - 回归表:R 方
R 方
R 方和调整 R 方描述了线性回归模型对数据点的拟合程度

R 方的值总是在 0 到 1 之间(0% 到 100%)。
- 高 R 方值表示许多数据点接近线性回归函数线。
- 低 R 方值表示线性回归函数线与数据拟合不佳。
低 R 方值(0.00)的视觉示例
我们的回归模型显示 R 方值为零,这意味着线性回归函数线与数据拟合不佳。
当我们绘制 Average_Pulse 和 Calorie_Burnage 的散点图以及线性回归函数时,可以看到这一点。

高 R 方值(0.79)的视觉示例
但是,如果我们绘制 **Duration** 和 **Calorie_Burnage**,R 方会增加。这里,我们看到数据点接近线性回归函数线。

这是 Python 代码
示例
import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats
full_health_data = pd.read_csv("data.csv", header=0, sep=",")
x = full_health_data["Duration"]
y = full_health_data ["Calorie_Burnage"]
slope, intercept, r, p, std_err = stats.linregress(x, y)
def myfunc(x)
return slope * x + intercept
mymodel = list(map(myfunc, x))
print(mymodel)
plt.scatter(x, y)
plt.plot(x, mymodel)
plt.ylim(ymin=0, ymax=2000)
plt.xlim(xmin=0, xmax=200)
plt.xlabel("Duration")
plt.ylabel ("Calorie_Burnage")
plt.show()
自己动手试一试 »
总结 - 使用 Average_Pulse 预测 Calorie_Burnage
如何总结以 Average_Pulse 为解释变量的线性回归函数?
- 系数为 0.3296,这意味着 Average_Pulse 对 Calorie_Burnage 的影响非常小。
- 高 P 值(0.824)表示我们无法得出 Average_Pulse 和 Calorie_Burnage 之间存在关系的结论。
- R 方值为 0,这意味着线性回归函数线与数据拟合不佳。