数据科学 - 绘制线性函数
运动手表数据集
查看我们的健康数据集
持续时间 | Average_Pulse | Max_Pulse | Calorie_Burnage | Hours_Work | Hours_Sleep |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
在 Python 中绘制现有数据
现在,我们可以使用 matplotlib 库首先绘制 Average_Pulse 与 Calorie_Burnage 的值。
plot() 函数用于绘制二维散点图 x,y
示例
import matplotlib.pyplot as plt
health_data.plot(x ='Average_Pulse', y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)
plt.show()
自己动手试一试 »
示例解释
- 导入 matplotlib 库的 pyplot 模块
- 绘制 Average_Pulse 与 Calorie_Burnage 的数据
- kind='line' 告诉我们想要哪种类型的图。这里,我们想要一条直线
- plt.ylim() 和 plt.xlim() 告诉我们想要坐标轴从哪个值开始。这里,我们想要坐标轴从零开始
- plt.show() 显示输出
上面的代码将产生以下结果

图形输出
正如我们所见,Average_Pulse 和 Calorie_Burnage 之间存在关系。Calorie_Burnage 随着 Average_Pulse 的增加而呈比例增加。这意味着我们可以使用 Average_Pulse 来预测 Calorie_Burnage。
为什么线没有完全画到 y 轴?
原因是,我们没有 Average_Pulse 或 Calorie_Burnage 为零的观测值。80 是 Average_Pulse 的第一个观测值,240 是 Calorie_Burnage 的第一个观测值。

看这条线。如果平均脉搏从 80 增加到 90,卡路里消耗会怎样?

我们可以使用对角线来找到数学函数来预测卡路里消耗。
结果表明
- 如果平均脉搏是 80,卡路里消耗是 240
- 如果平均脉搏是 90,卡路里消耗是 260
- 如果平均脉搏是 100,卡路里消耗是 280
有一个规律。如果平均脉搏增加 10,卡路里消耗增加 20。