R 因子
因子
因子用于对数据进行分类。例如,因子包括:
- 人口统计:男性/女性
- 音乐:摇滚、流行、古典、爵士
- 训练:力量、耐力
要创建因子,请使用 factor()
函数并将向量作为参数添加
示例
# 创建一个因子
music_genre <- factor(c("Jazz", "Rock", "Classic", "Classic", "Pop", "Jazz", "Rock", "Jazz"))
# 打印因子
music_genre
结果
[1] Jazz Rock Classic Classic Pop Jazz Rock Jazz Levels: Classic Jazz Pop Rock
从上面的例子可以看出,该因子有四个级别(类别):Classic、Jazz、Pop 和 Rock。
要仅打印级别,请使用 levels()
函数
示例
music_genre <- factor(c("Jazz", "Rock", "Classic", "Classic", "Pop", "Jazz", "Rock", "Jazz"))
levels(music_genre)
结果
[1] "Classic" "Jazz" "Pop" "Rock"
您还可以通过在 factor()
函数中添加 levels
参数来设置级别
示例
music_genre <- factor(c("Jazz", "Rock", "Classic", "Classic", "Pop", "Jazz", "Rock", "Jazz"), levels = c("Classic", "Jazz", "Pop", "Rock", "Other"))
levels(music_genre)
结果
[1] "Classic" "Jazz" "Pop" "Rock" "Other"
因子长度
使用 length()
函数找出因子中包含多少项
示例
music_genre <- factor(c("Jazz", "Rock", "Classic", "Classic", "Pop", "Jazz", "Rock", "Jazz"))
length(music_genre)
结果
[1] 8
访问因子
要访问因子中的项,请使用 []
方括号引用索引号
示例
访问第三项
music_genre <- factor(c("Jazz", "Rock", "Classic", "Classic", "Pop", "Jazz", "Rock", "Jazz"))
music_genre[3]
结果
[1] Classic Levels: Classic Jazz Pop Rock
修改单个项的值
通过索引号引用来修改特定项的值
示例
更改第三项的值
music_genre <- factor(c("Jazz", "Rock", "Classic", "Classic", "Pop", "Jazz", "Rock", "Jazz"))
music_genre[3] <- "Pop"
music_genre[3]
结果
[1] Pop Levels: Classic Jazz Pop Rock
请注意,如果一个项尚未在因子中指定,您将无法更改其值。以下示例将产生一个错误
示例
尝试将第三项(“Classic”)的值更改为不存在/未预定义的项(“Opera”)
music_genre <- factor(c("Jazz", "Rock", "Classic", "Classic", "Pop", "Jazz", "Rock", "Jazz"))
music_genre[3] <- "Opera"
music_genre[3]
结果
Warning message: In `[<-.factor`(`*tmp*`, 3, value = "Opera") : invalid factor level, NA generated
但是,如果您已经在 levels
参数中指定了它,它将起作用
示例
更改第三项的值
music_genre <- factor(c("Jazz", "Rock", "Classic", "Classic", "Pop", "Jazz", "Rock", "Jazz"), levels = c("Classic", "Jazz", "Pop", "Rock", "Opera"))
music_genre[3] <- "Opera"
music_genre[3]
结果
[1] Opera Levels: Classic Jazz Pop Rock Opera