机器学习 - 正态数据分布
正态数据分布
在上一章中,我们学习了如何创建给定大小且在两个给定值之间完全随机的数组。
在本章中,我们将学习如何创建值集中在给定值附近的数组。
在概率论中,这种数据分布被称为*正态数据分布*,或*高斯数据分布*,以提出这种数据分布公式的数学家卡尔·弗里德里希·高斯命名。
示例
典型的正态数据分布
import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()
结果
注意: 正态分布图也因其特征性的钟形而被称为*钟形曲线*。
直方图解释
我们使用来自 numpy.random.normal()
方法的数组,包含 100000 个值,绘制一个包含 100 个条形的直方图。
我们指定平均值为 5.0,标准差为 1.0。
这意味着这些值应该集中在 5.0 附近,并且很少偏离平均值超过 1.0。
从直方图中可以看出,大多数值在 4.0 到 6.0 之间,最高点大约在 5.0。