统计 - 众数
众数是一种平均值类型,它描述了大多数数据的位置。
众数
众数是在数据集中出现次数最多的值。
一个数据集可以有多个众数。
只有一个众数的值的分布称为**单峰分布**。
有两个众数的值的分布称为**双峰分布**。通常,有多个众数的分布称为**多峰分布**。
众数可以用于分类数据和数值数据。
寻找众数
这是一个**数值**示例
4, 7, 3, 8, 11, 7, 10, 19, 6, 9, 12, 12
7 和 12 各出现两次,其他值只出现一次。该数据的众数是 7 和 12。
这是一个包含名字的**分类**示例
Alice,John,Bob,Maria,John,Julia,Carol
John 出现两次,其他值只出现一次。该数据的众数是 John。
使用编程查找众数
许多编程语言都可以轻松地找到众数。
对于更大的数据集,使用软件和编程来计算统计数据更为常见,因为手动计算会很困难。
示例
在 Python 中,使用统计库的 multimode()
方法来查找 4,7,3,8,11,7,10,19,6,9,12,12 的众数。
from statistics import multimode
values = [4,7,3,8,11,7,10,19,6,9,12,12]
x = multimode(values)
print(x)
自己尝试 »
示例
使用 R 的用户自定义函数来查找 4,7,3,8,11,7,10,19,6,9,12,12 的众数。
mode <- function(x) {
unique_values <- unique(x)
table <- tabulate(match(x, unique_values))
unique_values[table == max(table)]
}
values <- c(4,7,3,8,11,7,10,19,6,9,12,12)
mode(values)
自己尝试 »
注意:R 没有内置函数来查找众数。