数据科学 函数
本章介绍了在数据科学工作中常用的三个函数:max()、min() 和 mean()。
运动手表数据集
时长 | 平均脉率 | 最大脉率 | 卡路里消耗 | 工作时长 | 睡眠时长 |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
以上数据集包含 6 个变量,每个变量有 10 个观测值。
- 时长 - 训练课程持续了多长时间(分钟)?
- 平均脉率 - 训练课程的平均脉率是多少?以每分钟跳动次数测量。
- 最大脉率 - 训练课程的最大脉率是多少?
- 卡路里消耗 - 训练课程消耗了多少卡路里?
- 工作时长 - 训练课程之前我们在工作中花了多少时间?
- 睡眠时长 - 训练课程前一天晚上我们睡了多久?
我们使用下划线 (_) 分隔字符串,因为 Python 无法将空格识别为分隔符。
max() 函数
Python 的 max()
函数用于查找数组中的最大值。
示例
Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print (Average_pulse_max)
自己尝试 »
min() 函数
Python 的 min()
函数用于查找数组中的最小值。
示例
Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print (Average_pulse_min)
自己尝试 »
mean() 函数
NumPy 的 mean()
函数用于查找数组的平均值。
示例
import numpy as np
Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]
Average_calorie_burnage = np.mean(Calorie_burnage)
print(Average_calorie_burnage)
自己尝试 »
注意:我们在 mean 前面写 np.,是为了让 Python 知道我们想要激活来自 Numpy 库的 mean 函数。