机器学习统计
统计是获取数据答案的工具
- 常见是什么?
- 预期是什么?
- 正常是什么?
- 概率是什么?
推论统计
推断统计是从一个小样本量化总体特征的方法
您从样本中获取数据,并对整个总体进行预测。
例如,您可以在一家商店中站着,询问100人样本是否喜欢巧克力。
根据您的研究,使用推断统计,您可以预测所有顾客中有91%喜欢巧克力。
令人难以置信的巧克力事实
十个人中有九个人喜欢巧克力。
美国人口的50%无法忍受每天没有巧克力。
您使用推断统计从少量数据样本预测整个领域。
描述性统计
描述性统计总结(描述)一组数据的观察结果。
由于我们登记每个新生儿,我们可以知道100个中有51个是男孩。
根据这些收集到的数字,我们可以预测新生的婴儿是男孩的概率为51%。
令人费解的是,这个比例不是50%,这与基本的生物学预测不符。我们只知道自17世纪以来,性别比例一直倾斜。
注意
原始观察只是数据。它们不是真正的知识。
您使用描述性统计将原始观察转化为您可以理解的数据。
描述性统计度量
描述性统计被分为不同的度量
集中趋势(中心度量)
- 均值(平均值)
- 中位数(中点值)
- 众数(最常见的值)
离散程度(变异性度量)
- 最小值和最大值
- 标准差
- 方差
- 偏度(Skewness)
- 峰度(Kurtosis)