机器学习 - 正态数据分布
正态数据分布
在上一章中,我们学习了如何创建一个完全随机的数组,该数组具有给定的大小,并在两个给定值之间。
在本章中,我们将学习如何创建一个数组,其中值集中在给定值附近。
在概率论中,这种数据分布被称为 *正态数据分布* 或 *高斯数据分布*,以数学家卡尔·弗里德里希·高斯的名字命名,他提出了这种数据分布的公式。
示例
典型的正态数据分布
import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()
结果
运行示例 »注意: 正态分布图也称为钟形曲线,因为它的形状像一个钟。
直方图解释
我们使用来自numpy.random.normal()
方法的数组,其中包含 100000 个值,来绘制一个包含 100 个条形的直方图。
我们指定平均值为 5.0,标准差为 1.0。
这意味着值应该集中在 5.0 附近,很少会比平均值远 1.0。
从直方图中可以看出,大多数值介于 4.0 和 6.0 之间,峰值大约在 5.0 处。