齐夫分布
齐夫分布用于根据齐夫定律对数据进行采样。
齐夫定律:在一个集合中,第 n 个最常见的项是出现频率最高的项的 1/n 倍。例如,英语中第五个最常见的单词出现的频率大约是出现频率最高的单词的 1/5 倍。
它有两个参数
a
- 分布参数。
size
- 返回数组的形状。
示例
绘制一个具有分布参数 2 和大小为 2x3 的齐夫分布样本
from numpy import random
x = random.zipf(a=2, size=(2, 3))
print(x)
自己试试 »
齐夫分布的可视化
采样 1000 个点,但仅绘制值小于 10 的点,以获得更有意义的图表。
示例
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)
plt.show()