数据科学 - 绘制线性函数
运动手表数据集
来看看我们的健康数据集
时长 | 平均脉搏 | 最大脉搏 | 卡路里燃烧 | 工作时长 | 睡眠时长 |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
在 Python 中绘制现有数据
现在,我们可以首先使用 matplotlib 库绘制平均脉搏与卡路里燃烧的值。
该 plot()
函数用于创建点 x,y 的二维六边形分箱图
示例
import matplotlib.pyplot as plt
health_data.plot(x ='Average_Pulse', y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)
plt.show()
自己尝试 »
示例说明
- 导入 matplotlib 库的 pyplot 模块
- 绘制平均脉搏与卡路里燃烧的数据
kind='line'
告诉我们我们想要哪种类型的图。在这里,我们想要一条直线- plt.ylim() 和 plt.xlim() 告诉我们我们想要轴从哪个值开始。在这里,我们希望轴从零开始
- plt.show() 显示输出
以上代码将产生以下结果
图形输出
我们可以看到,平均脉搏和卡路里燃烧之间存在关系。卡路里燃烧与平均脉搏成正比增加。这意味着我们可以使用平均脉搏来预测卡路里燃烧。
为什么线没有完全绘制到 y 轴?
原因是我们没有平均脉搏或卡路里燃烧等于零的观察值。80 是平均脉搏的第一个观察值,240 是卡路里燃烧的第一个观察值。
看看这条线。如果平均脉搏从 80 增加到 90,卡路里燃烧会发生什么?
我们可以使用对角线找到预测卡路里燃烧的数学函数。
事实证明
- 如果平均脉搏为 80,则卡路里燃烧为 240
- 如果平均脉搏为 90,则卡路里燃烧为 260
- 如果平均脉搏为 100,则卡路里燃烧为 280
有一个规律。如果平均脉搏增加 10,则卡路里燃烧增加 20。