随机数据分布

什么是数据分布？

数据分布是所有可能值的列表，以及每个值出现的频率。

在处理统计和数据科学时，这类列表很重要。

random 模块提供了返回随机生成数据分布的方法。

随机分布是一组遵循特定概率密度函数的随机数。

概率密度函数：描述连续概率的函数。即数组中所有值的概率。

我们可以使用 random 模块的 choice() 方法，根据定义的概率生成随机数。

choice() 方法允许我们指定每个值出现的概率。

概率由 0 到 1 之间的数字设置，其中 0 表示该值永远不会出现，1 表示该值总是会发生。

生成一个包含 100 个值的 1-D 数组，其中每个值必须是 3、5、7 或 9。

值为 3 的概率设置为 0.1

值为 5 的概率设置为 0.3

值为 7 的概率设置为 0.6

值为 9 的概率设置为 0

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(100))

print(x)

所有概率数字的总和应为 1。

即使您运行上面的示例 100 次，值 9 也永远不会出现。

通过在 size 参数中指定形状，您可以返回任何形状和大小的数组。

与上面的示例相同，但返回一个 3 行 5 列的 2-D 数组。

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(3, 5))

print(x)

W3schools 学习路径

跟踪您的进度 - 免费！