数据科学 - 数据库表
数据库表
数据库表是一个包含结构化数据的表格。
下表显示了一个从运动手表中提取的健康数据的数据库表
持续时间 | 平均脉搏 | 最大脉搏 | 卡路里消耗 | 工作时长 | 睡眠时长 |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
此数据集包含典型训练课程的信息,例如持续时间、平均脉搏、卡路里消耗等。
数据库表结构
数据库表由列和行组成
列 1 | 列 2 | 列 3 | 列 4 | 列 5 | 列 6 | |
持续时间 | 平均脉搏 | 最大脉搏 | 卡路里消耗 | 工作时长 | 睡眠时长 | |
---|---|---|---|---|---|---|
行 1 | 30 | 80 | 120 | 240 | 10 | 7 |
行 2 | 30 | 85 | 120 | 250 | 10 | 7 |
行 3 | 45 | 90 | 130 | 260 | 8 | 7 |
行 4 | 45 | 95 | 130 | 270 | 8 | 7 |
行 5 | 45 | 100 | 140 | 280 | 0 | 7 |
行 6 | 60 | 105 | 140 | 290 | 7 | 8 |
行 7 | 60 | 110 | 145 | 300 | 7 | 8 |
行 8 | 60 | 115 | 145 | 310 | 8 | 8 |
行 9 | 75 | 120 | 150 | 320 | 0 | 8 |
行 10 | 75 | 125 | 150 | 330 | 8 | 8 |
行是数据的水平表示。
列是数据的垂直表示。
变量
变量被定义为可以测量或计数的事物。
例如字符、数字或时间。
在下面的示例中,我们可以观察到每一列都代表一个变量。
持续时间 | 平均脉搏 | 最大脉搏 | 卡路里消耗 | 工作时长 | 睡眠时长 |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
有 6 列,这意味着有 6 个变量(持续时间、平均脉搏、最大脉搏、卡路里消耗、工作时长、睡眠时长)。
有 11 行,这意味着每个变量有 10 个观测值。
但是如果有 11 行,为什么只有 10 个观测值呢?
这是因为第一行是标签,意味着它是变量的名称。