数据科学 - 线性函数
作为数据科学家,了解数学函数非常重要,因为我们需要进行预测并对其进行解释。
线性函数
在数学中,函数用于关联一个变量与另一个变量。
假设我们考虑卡路里燃烧量和平均脉搏之间的关系。可以合理地假设,一般来说,卡路里燃烧量会随着平均脉搏的变化而变化——我们说卡路里燃烧量取决于平均脉搏。
此外,可以合理地假设,随着平均脉搏的增加,卡路里燃烧量也会增加。卡路里燃烧量和平均脉搏是正在考虑的两个变量。
因为卡路里燃烧量取决于平均脉搏,所以我们说卡路里燃烧量是因变量,平均脉搏是自变量。
因变量和自变量之间的关系通常可以使用公式(函数)用数学方式表达。
线性函数有一个自变量 (x) 和一个因变量 (y),并且具有以下形式
y = f(x) = ax + b
当我们为自变量选择一个值时,此函数用于计算因变量的值。
解释
- f(x) = 输出(因变量)
- x = 输入(自变量)
- a = 斜率 = 是自变量的系数。它给出了因变量的变化率
- b = 截距 = 当 x = 0 时因变量的值。它也是对角线与垂直轴相交的点。
具有一个解释变量的线性函数
具有一个解释变量的函数意味着我们使用一个变量进行预测。
假设我们想使用平均脉搏预测卡路里燃烧量。我们有以下公式:
f(x) = 2x + 80
此处,数字和变量的含义为
- f(x) = 输出。此数字是我们获得卡路里燃烧量预测值的地方
- x = 输入,即平均脉搏
- 2 = 斜率 = 指定如果平均脉搏增加一个单位,卡路里燃烧量会增加多少。它告诉我们对角线的“陡峭”程度
- 80 = 截距 = 固定值。当 x = 0 时,它是因变量的值
绘制线性函数
术语线性表示“直线”。因此,如果您以图形方式显示线性函数,则该线始终为直线。该线可以向上倾斜、向下倾斜,在某些情况下也可能是水平或垂直的。
以下是上面数学函数的图形表示
图形说明
- 水平轴通常称为 x 轴。此处,它表示平均脉搏。
- 垂直轴通常称为 y 轴。此处,它表示卡路里燃烧量。
- 卡路里燃烧量是平均脉搏的函数,因为卡路里燃烧量被假定为依赖于平均脉搏。
- 换句话说,我们使用平均脉搏来预测卡路里燃烧量。
- 蓝色(对角线)表示预测卡路里燃烧量的数学函数的结构。