机器学习统计
统计学是获取有关数据问题的答案的工具
- 什么是常见的?
- 什么是预期的?
- 什么是正常的?
- 什么是概率?
推论统计
推论统计是从一个小样本中量化总体属性的方法
您从样本中获取数据并对整个总体进行预测。
例如,您可以在商店里站着,询问100 人的样本是否喜欢巧克力。
根据您的研究,使用推论统计,您可以预测所有购物者中 91% 的人喜欢巧克力。
令人难以置信的巧克力事实
十个人中有九个人喜欢巧克力。
50% 的美国人口每天都离不开巧克力。
您使用推论统计根据少量数据样本预测整个领域。
描述性统计
描述性统计总结(描述)一组数据中的观察结果。
由于我们登记了每个新生儿,所以我们可以说 100 个新生儿中有 51 个是男孩。
从这些收集到的数字中,我们可以预测新生儿是男孩的概率为 51%。
这个比例不是 50% 这是一个谜,就像基本的生物学预测的那样。我们只知道自 17 世纪以来,我们一直存在这种倾斜的性别比例。
注意
原始观察结果只是数据。它们不是真正的知识。
您使用描述性统计将原始观察结果转换为您可以理解的数据。
描述性统计测量
描述性统计分为不同的度量
趋势(中心测量)
- 平均值(平均值)值
- 中位数(中间值)
- 众数(最常见的值)
离散度(变异性测量)
- 最小值和最大值
- 标准差
- 方差
- 偏度
- 峰度