Menu
×
   ❮     
HTML CSS JAVASCRIPT SQL PYTHON JAVA PHP HOW TO W3.CSS C C++ C# BOOTSTRAP REACT MYSQL JQUERY EXCEL XML DJANGO NUMPY PANDAS NODEJS R TYPESCRIPT ANGULAR GIT POSTGRESQL MONGODB ASP AI GO KOTLIN SASS VUE DSA GEN AI SCIPY AWS CYBERSECURITY DATA SCIENCE
     ❯   

R 数据集


数据集

数据集是一组数据,通常以表格的形式呈现。

R 中有一个流行的内置数据集,名为“mtcars”(汽车趋势汽车道路测试),它来自 1974 年汽车趋势美国杂志。

在下面的示例中(以及接下来的章节中),我们将使用 mtcars 数据集,用于统计目的。

示例

# 打印 mtcars 数据集
mtcars

结果

                     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
Hornet 4 Drive      21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1
Hornet Sportabout   18.7   8 360.0 175 3.15 3.440 17.02  0  0    3    2
Valiant             18.1   6 225.0 105 2.76 3.460 20.22  1  0    3    1
Duster 360          14.3   8 360.0 245 3.21 3.570 15.84  0  0    3    4
Merc 240D           24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2
Merc 230            22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2
Merc 280            19.2   6 167.6 123 3.92 3.440 18.30  1  0    4    4
Merc 280C           17.8   6 167.6 123 3.92 3.440 18.90  1  0    4    4
Merc 450SE          16.4   8 275.8 180 3.07 4.070 17.40  0  0    3    3
Merc 450SL          17.3   8 275.8 180 3.07 3.730 17.60  0  0    3    3
Merc 450SLC         15.2   8 275.8 180 3.07 3.780 18.00  0  0    3    3
Cadillac Fleetwood  10.4   8 472.0 205 2.93 5.250 17.98  0  0    3    4
Lincoln Continental 10.4   8 460.0 215 3.00 5.424 17.82  0  0    3    4
Chrysler Imperial   14.7   8 440.0 230 3.23 5.345 17.42  0  0    3    4
Fiat 128            32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1
Honda Civic         30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2
Toyota Corolla      33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1
Toyota Corona       21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1
Dodge Challenger    15.5   8 318.0 150 2.76 3.520 16.87  0  0    3    2
AMC Javelin         15.2   8 304.0 150 3.15 3.435 17.30  0  0    3    2
Camaro Z28          13.3   8 350.0 245 3.73 3.840 15.41  0  0    3    4
Pontiac Firebird    19.2   8 400.0 175 3.08 3.845 17.05  0  0    3    2
Fiat X1-9           27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1
Porsche 914-2       26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2
Lotus Europa        30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2
Ford Pantera L      15.8   8 351.0 264 4.22 3.170 14.50  0  1    5    4
Ferrari Dino        19.7   6 145.0 175 3.62 2.770 15.50  0  1    5    6
Maserati Bora       15.0   8 301.0 335 3.54 3.570 14.60  0  1    5    8
Volvo 142E          21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2
自己尝试 »

关于数据集的信息

您可以使用问号 (?) 来获取有关 mtcars 数据集的信息

示例

# 使用问号获取有关数据集的信息

?mtcars

结果

mtcars {datasets}R 文档

汽车趋势汽车道路测试

描述

该数据摘自 1974 年的汽车趋势美国杂志,包括 32 辆汽车(1973-74 年型号)的燃油消耗量以及 10 个汽车设计和性能方面。

用法

mtcars

格式

包含 32 个观察值的 11 个(数值)变量的数据框。

[, 1] mpg英里/(美国)加仑
[, 2] cyl汽缸数
[, 3] disp排量(立方英寸)
[, 4] hp净马力
[, 5] drat后桥速比
[, 6] wt重量(1000 磅)
[, 7] qsec1/4 英里时间
[, 8] vs发动机(0 = V 形,1 = 直列)
[, 9] am变速箱(0 = 自动,1 = 手动)
[,10] gear前进档数
[,11] carb化油器数量

注意

Henderson 和 Velleman (1981) 在表格 1 的脚注中评论道:'Hocking [原始抄写员] 将马自达的转子发动机非关键地编码为直列六缸发动机,将保时捷的水平对置发动机编码为 V 型发动机,以及包含柴油梅赛德斯 240D,保留了这些信息,以便能够直接比较以前进行的分析。'

来源

Henderson 和 Velleman (1981),交互式构建多元回归模型。生物统计学37,391-411。

示例

require(graphics)
pairs(mtcars, main = "mtcars data", gap = 1/4)
coplot(mpg ~ disp | as.factor(cyl), data = mtcars,
       panel = panel.smooth, rows = 1)
## possibly more meaningful, e.g., for summary() or bivariate plots:
mtcars2 <- within(mtcars, {
   vs <- factor(vs, labels = c("V", "S"))
   am <- factor(am, labels = c("automatic", "manual"))
   cyl  <- ordered(cyl)
   gear <- ordered(gear)
   carb <- ordered(carb)
})
summary(mtcars2)
自己尝试 »


获取信息

使用 dim() 函数查找数据集的维度,使用 names() 函数查看变量的名称

示例

Data_Cars <- mtcars # 创建 mtcars 数据集的变量,以便更好地组织

# 使用 dim() 查找数据集的维度
dim(Data_Cars)

# 使用 names() 查找数据集的变量名称
names(Data_Cars)

结果

[1] 32 11
 [1] "mpg"  "cyl"  "disp" "hp"   "drat" "wt"   "qsec" "vs"   "am"   "gear"
[11] "carb"
自己尝试 »

使用 rownames() 函数获取第一列中每一行的名称,即每辆车的名称

示例

Data_Cars <- mtcars

rownames(Data_Cars)

结果

 [1] "Mazda RX4"           "Mazda RX4 Wag"       "Datsun 710"         
 [4] "Hornet 4 Drive"      "Hornet Sportabout"   "Valiant"            
 [7] "Duster 360"          "Merc 240D"           "Merc 230"           
[10] "Merc 280"            "Merc 280C"           "Merc 450SE"         
[13] "Merc 450SL"          "Merc 450SLC"         "Cadillac Fleetwood" 
[16] "Lincoln Continental" "Chrysler Imperial"   "Fiat 128"           
[19] "Honda Civic"         "Toyota Corolla"      "Toyota Corona"      
[22] "Dodge Challenger"    "AMC Javelin"         "Camaro Z28"         
[25] "Pontiac Firebird"    "Fiat X1-9"           "Porsche 914-2"      
[28] "Lotus Europa"        "Ford Pantera L"      "Ferrari Dino"       
[31] "Maserati Bora"       "Volvo 142E"         
自己尝试 »

从上面的示例中,我们发现数据集有 32 个观察值(马自达 RX4、马自达 RX4 Wag、日产 710 等)和 11 个变量(mpg、cyl、disp 等)。

变量被定义为可以测量或计数的东西。

以下是 mtcars 数据集变量的简要说明

变量名称 描述
mpg 英里/(美国)加仑
cyl 汽缸数
disp 排量
hp 净马力
drat 后桥速比
wt 重量(1000 磅)
qsec 1/4 英里时间
vs 发动机(0 = V 形,1 = 直列)
am 变速箱(0 = 自动,1 = 手动)
gear 前进档数
carb 化油器数量

打印变量值

如果您想打印属于某个变量的所有值,请使用 $ 符号和变量名称(例如 cyl (汽缸数))访问数据框

示例

Data_Cars <- mtcars

Data_Cars$cyl

结果

 [1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4
自己尝试 »

对变量值进行排序

要对值进行排序,请使用 sort() 函数

示例

Data_Cars <- mtcars

sort(Data_Cars$cyl)

结果

 [1] 4 4 4 4 4 4 4 4 4 4 4 6 6 6 6 6 6 6 8 8 8 8 8 8 8 8 8 8 8 8 8 8
自己尝试 »

从上面的示例中,我们看到大多数汽车有 4 个和 8 个汽缸。


分析数据

现在我们已经了解了一些关于数据集的信息,我们可以开始使用一些统计数字来分析它。

例如,我们可以使用 summary() 函数来获取数据的统计摘要

示例

Data_Cars <- mtcars

summary(Data_Cars)
自己尝试 »

如果您不理解输出数字,请不要担心。您很快就会掌握它们。

summary() 函数为每个变量返回六个统计数字

  • 最小值
  • 第一百分位数(百分位数)
  • 中位数
  • 平均数
  • 第三百分位数(百分位数)
  • 最大值

我们将在接下来的章节中介绍所有这些内容,以及其他统计数字。



×

Contact Sales

If you want to use W3Schools services as an educational institution, team or enterprise, send us an e-mail:
[email protected]

Report Error

If you want to report an error, or if you want to make a suggestion, send us an e-mail:
[email protected]

W3Schools is optimized for learning and training. Examples might be simplified to improve reading and learning. Tutorials, references, and examples are constantly reviewed to avoid errors, but we cannot warrant full correctness of all content. While using W3Schools, you agree to have read and accepted our terms of use, cookie and privacy policy.

Copyright 1999-2024 by Refsnes Data. All Rights Reserved. W3Schools is Powered by W3.CSS.