ML 术语
- 关系
- 标签
- 特征
机器学习关系
机器学习系统使用输入之间的关系来生成预测。
在代数中,关系通常写成y = ax + b
- y 是我们要预测的标签
- a 是直线的斜率
- x 是输入值
- b 是截距
使用 ML,关系写成y = b + wx
- y 是我们要预测的标签
- w 是权重(斜率)
- x 是特征(输入值)
- b 是截距
机器学习标签
在机器学习术语中,标签是我们想要预测的东西。
它就像线性图中的y
代数 | 机器学习 |
y = ax + b | y = b + wx |
机器学习特征
在机器学习术语中,特征是输入。
它们就像线性图中的x 值
代数 | 机器学习 |
y = ax + b | y = b + wx |
有时可能有多个特征(输入值)具有不同的权重
y = b + w1x1 + w2x2 + w3x3 + w4x4
- 机器学习模型
- 机器学习训练
- 机器学习推理
- 机器学习阶段
机器学习模型
模型定义了标签 (y) 和特征 (x) 之间的关系。
模型的生命周期有三个阶段
- 数据收集
- 训练
- 推理
机器学习训练
训练的目的是创建一个可以回答问题的模型。例如,房屋的预期价格是多少?
机器学习推理
推理是在训练好的模型被用来推断(预测)使用实时数据的值时。例如,将模型投入生产。
机器学习阶段
机器学习有两个主要阶段
1. 训练
输入数据用于计算模型的参数。
2. 推理
"训练好的"模型从任何输入中输出正确的数据。
- 监督式机器学习
- 无监督式机器学习
- 自监督式机器学习
监督学习
监督式机器学习使用一组输入变量来预测输出变量的值。
监督学习使用标记数据(具有已知答案的数据)来训练算法以
- 分类数据
- 预测结果
监督学习可以分类数据,例如根据已知的垃圾邮件示例,"电子邮件中的垃圾邮件是什么"。
监督学习可以预测结果,例如根据你玩过的视频预测你喜欢哪种视频。
无监督学习
无监督式机器学习使用任何未标记数据集中的模式,试图理解数据中的模式(或分组)。
无监督学习用于预测未定义的关系,例如数据中的有意义模式。
它是关于创建可以自我改进的计算机算法。
预计机器学习将转向无监督学习,以允许程序员在不创建模型的情况下解决问题。
强化学习
强化学习基于非监督学习,但会从用户那里获得关于决策是好是坏的反馈。反馈有助于改进模型。
自监督学习
自监督学习类似于无监督学习,因为它使用的数据没有人类添加的标签。
不同之处在于无监督学习使用聚类、分组和降维,而自监督学习则为回归和分类任务得出自己的结论。