Pandas DataFrame describe() 方法
示例
返回 DataFrame 中数据的统计描述
import pandas as pd
data = [[10, 18, 11], [13, 15, 8], [9, 20, 3]]
df = pd.DataFrame(data)
print(df.describe())
自己试试 »
定义和用法
describe()
方法返回 DataFrame 中数据的描述。
如果 DataFrame 包含数值数据,则描述包含每个列的以下信息
count - 非空值的个数。
mean - 平均值。
std - 标准差。
min - 最小值。
25% - 第 25 个百分位数*。
50% - 第 50 个百分位数*。
75% - 第 75 个百分位数*。
max - 最大值。
*百分位数含义:有多少个值小于给定的百分位数。有关百分位数的更多信息,请参阅我们的 机器学习百分位数 章节。
语法
dataframe.describe(percentiles, include, exclude, datetime_is_numeric)
参数
percentile
、include
、exclude
、datetime_is_numeric
参数是 关键字参数。
参数 | 值 | 描述 |
---|---|---|
percentile | 介于 0 和 1 之间 |
可选,结果中包含的百分位数列表,默认为[.25, .50, .75] . |
include | None 数据类型 |
可选,结果中允许的数据类型列表 |
exclude | None 数据类型 |
可选,结果中不允许的数据类型列表 |
datetime_is_numeric | True |
可选,默认为 False。设置为 True 以将日期时间数据视为数值 |
返回值
一个包含每行统计信息的 DataFrame 对象。