Pandas DataFrame groupby() 方法
示例
查找每个汽车品牌的平均二氧化碳排放量
import pandas as pd
data = {
'co2': [95, 90, 99, 104, 105, 94, 99, 104],
'model': ['Citigo', 'Fabia', 'Fiesta', 'Rapid', 'Focus', 'Mondeo', 'Octavia', 'B-Max'],
'car': ['Skoda', 'Skoda', 'Ford', 'Skoda', 'Ford', 'Ford', 'Skoda', 'Ford']
}
df = pd.DataFrame(data)
print(df.groupby(["car"]).mean())
自己尝试 »
定义和用法
The groupby()
方法允许你对数据进行分组并在这些组上执行函数。
语法
dataframe.transform(by, axis, level, as_index, sort, group_keys, observed, dropna)
参数
axis
、level
、as_index
、sort
、group_keys
、observed
、dropna
参数是关键字参数。
参数 | 值 | 描述 |
---|---|---|
by | 必填。标签、标签列表或用于指定如何对 DataFrame 进行分组的函数。 | |
axis | 0 |
可选,对哪个轴进行分组,默认为 0。 |
level | levelNone |
可选。指定是否应按特定级别进行分组。默认为 None |
as_index | True |
可选,默认为 True。如果结果不应使用组标签作为索引,则设置为 False |
sort | True |
可选,默认为 True。如果结果不应排序组键(以获得更好的性能),则设置为 False |
group_keys | True |
可选,默认为 True。如果结果不应将组键添加到索引,则设置为 False |
dropna | True |
可选,默认为 True。如果结果应包含组键为 NULL 值的行/列,则设置为 False |
返回值
一个 DataFrameGroupBy 对象,其中行/列已分组。