Pandas DataFrame groupby() 方法
示例
计算每辆汽车品牌的平均二氧化碳排放量
import pandas as pd
data = {
'co2': [95, 90, 99, 104, 105, 94, 99, 104],
'model': ['Citigo', 'Fabia', 'Fiesta', 'Rapid', 'Focus', 'Mondeo', 'Octavia', 'B-Max'],
'car': ['Skoda', 'Skoda', 'Ford', 'Skoda', 'Ford', 'Ford', 'Skoda', 'Ford']
}
df = pd.DataFrame(data)
print(df.groupby(["car"]).mean())
自己动手试一试 »
定义和用法
groupby()
方法允许您对数据进行分组并对这些组执行函数。
语法
dataframe.transform(by, axis, level, as_index, sort, group_keys, observed, dropna)
参数
axis
、level
、as_index
、sort
、group_keys
、observed
、dropna
参数是关键字参数。
参数 | 值 | 描述 |
---|---|---|
by | 必需。一个标签、一组标签或一个用于指定如何分组 DataFrame 的函数。 | |
axis | 0 |
可选。指定按哪个轴进行分组,默认为 0。 |
level | level无 |
可选。指定是否按特定级别进行分组。默认为 None |
as_index | True |
可选,默认为 True。如果结果不应使用组标签作为索引,则设置为 False。 |
排序 | True |
可选,默认为 True。为提高性能,如果不希望对组键进行排序,则设置为 False。 |
group_keys | True |
可选,默认为 True。如果不希望将组键添加到索引,则设置为 False。 |
dropna | True |
可选,默认为 True。如果结果应包含组键为 NULL 值(空值)的行/列,则设置为 False。 |
返回值
一个 DataFrameGroupBy 对象,其中行/列已分组。