Pandas - DataFrame 参考
DataFrame 对象的所有属性和方法,以及解释和示例
属性/方法 | 描述 |
---|---|
abs() | 返回一个 DataFrame,其中包含每个值的绝对值 |
add() | 将 DataFrame 的值与指定的值相加 |
add_prefix() | 为所有标签添加前缀 |
add_suffix() | 为所有标签添加后缀 |
agg() | 将函数或函数名应用于 DataFrame 的一个轴 |
aggregate() | 将函数或函数名应用于 DataFrame 的一个轴 |
align() | 使用指定的连接方法对齐两个 DataFrames |
all() | 如果 DataFrame 中的所有值都为 True,则返回 True,否则返回 False |
any() | 如果 DataFrame 中的任何值为 True,则返回 True,否则返回 False |
append() | 追加新列 |
applymap() | 对 DataFrame 中的每个元素执行一个函数 |
apply() | 将函数应用于 DataFrame 的一个轴 |
assign() | 分配新列 |
astype() | 将 DataFrame 转换为指定的数据类型 |
at | 获取或设置具有指定标签的项目的价值 |
axes | 返回 DataFrame 的行和列的标签 |
bfill() | 用下一行的值替换 NULL 值 |
bool() | 返回 DataFrame 的布尔值 |
columns | 返回 DataFrame 的列标签 |
combine() | 比较两个 DataFrames 中的值,并让一个函数决定保留哪些值 |
combine_first() | 比较两个 DataFrames,如果第一个 DataFrame 具有 NULL 值,则将使用第二个 DataFrame 中的相应值填充 |
compare() | 比较两个 DataFrames 并返回差异 |
convert_dtypes() | 将 DataFrame 中的列转换为新的数据类型 |
corr() | 查找每列之间的相关性(关系) |
count() | 返回每列/行的非空单元格数量 |
cov() | 查找列的协方差 |
copy() | 返回 DataFrame 的副本 |
cummax() | 计算 DataFrame 的累积最大值 |
cummin() | 计算 DataFrame 的累积最小值 |
cumprod() | 计算 DataFrame 的累积乘积 |
cumsum() | 计算 DataFrame 的累积总和 |
describe() | 返回 DataFrame 中每列的描述性摘要 |
diff() | 计算一个值与前一行的同一列的值之间的差异 |
div() | 将 DataFrame 的值与指定的值相除 |
dot() | 将 DataFrame 的值乘以另一个类数组对象的值,并添加结果 |
drop() | 从 DataFrame 中删除指定的行/列 |
drop_duplicates() | 从 DataFrame 中删除重复值 |
droplevel() | 删除指定的索引/列 |
dropna() | 删除所有包含 NULL 值的行 |
dtypes | 返回 DataFrame 的列的数据类型 |
duplicated() | 对于重复的行返回 True,否则返回 False |
empty | 如果 DataFrame 为空,则返回 True,否则返回 False |
eq() | 对于等于指定值的值返回 True,否则返回 False |
equals() | 如果两个 DataFrames 相等,则返回 True,否则返回 False |
eval | 计算指定的字符串 |
explode() | 将每个元素转换为一行 |
ffill() | 用前一行的值替换 NULL 值 |
fillna() | 用指定的值替换 NULL 值 |
filter() | 根据指定的过滤器筛选 DataFrame |
first() | 返回指定日期选择的首行 |
floordiv() | 将 DataFrame 的值与指定的值相除,并将值取整 |
ge() | 对于大于或等于指定值的值返回 True,否则返回 False |
get() | 返回指定键的项目 |
groupby() | 将行/列分组为指定的组 |
gt() | 对于大于指定值的值返回 True,否则返回 False |
head() | 返回标题行和前 10 行,或指定行数 |
iat | 获取或设置指定位置的项目的价值 |
idxmax() | 返回指定轴中最大值的标签 |
idxmin() | 返回指定轴中最小值的标签 |
iloc | 获取或设置指定位置的一组元素的值 |
index | 返回 DataFrame 的行标签 |
infer_objects() | 更改 DataFrame 中列的数据类型 |
info() | 打印有关 DataFrame 的信息 |
insert() | 在 DataFrame 中插入一列 |
interpolate() | 用插值方法替换非数字值 |
isin() | 如果 DataFrame 中的每个元素都在指定的值中,则返回 True |
isna() | 查找非数字值 |
isnull() | 查找 NULL 值 |
items() | 遍历 DataFrame 的列 |
iteritems() | 遍历 DataFrame 的列 |
iterrows() | 遍历 DataFrame 的行 |
itertuples() | 将行作为命名元组进行迭代 |
join() | 连接另一个 DataFrame 的列 |
last() | 返回指定日期选择的最后一行 |
le() | 对于小于或等于指定值的值返回 True,否则返回 False |
loc | 获取或设置使用其标签指定的一组元素的值 |
lt() | 对于小于指定值的值返回 True,否则返回 False |
keys() | 返回信息轴的键 |
kurtosis() | 返回指定轴中值的峰度 |
mask() | 替换指定条件为 True 的所有值 |
max() | 返回指定轴中值的最大值 |
mean() | 返回指定轴中值的平均值 |
median() | 返回指定轴中值的中间值 |
melt() | 将 DataFrame 从宽表重塑为长表 |
memory_usage() | 返回每列的内存使用情况 |
merge() | 合并 DataFrame 对象 |
min() | 返回指定轴中值的最小值 |
mod() | DataFrame 值的模数(求余) |
mode() | 返回指定轴中值的众数 |
mul() | 将 DataFrame 的值乘以指定的值 |
ndim | 返回 DataFrame 的维数 |
ne() | 对于不等于指定值的值返回 True,否则返回 False |
nlargest() | 按指定的列降序排序 DataFrame,并返回指定行数 |
notna() | 查找不是非数字的值 |
notnull() | 查找不是 NULL 的值 |
nsmallest() | 按指定的列升序排序 DataFrame,并返回指定行数 |
nunique() | 返回指定轴中唯一值的个数 |
pct_change() | 返回前一个值和当前值之间的百分比变化 |
pipe() | 将函数应用于 DataFrame |
pivot() | 重新整形 DataFrame |
pivot_table() | 创建电子表格透视表作为 DataFrame |
pop() | 从 DataFrame 中删除元素 |
pow() | 将一个 DataFrame 的值提升到另一个 DataFrame 的值 |
prod() | 返回指定轴中所有值的乘积 |
product() | 返回指定轴中值的乘积 |
quantile() | 返回指定轴中指定分位数的值 |
query() | 查询 DataFrame |
radd() | 将一个 DataFrame 的值反向加到另一个 DataFrame 的值 |
rdiv() | 将一个 DataFrame 的值反向除以另一个 DataFrame 的值 |
reindex() | 更改 DataFrame 的标签 |
reindex_like() | ?? |
rename() | 更改轴的标签 |
rename_axis() | 更改轴的名称 |
reorder_levels() | 重新排序索引级别 |
replace() | 替换指定的值 |
reset_index() | 重置索引 |
rfloordiv() | 将一个 DataFrame 的值反向除以另一个 DataFrame 的值 |
rmod() | 将一个 DataFrame 的值反向模数到另一个 DataFrame 的值 |
rmul() | 将一个 DataFrame 的值反向乘以另一个 DataFrame 的值 |
round() | 返回一个 DataFrame,其中所有值都四舍五入为指定的格式 |
rpow() | 将一个 DataFrame 的值反向提升到另一个 DataFrame 的值 |
rsub() | 将一个 DataFrame 的值反向减去另一个 DataFrame 的值 |
rtruediv() | 将一个 DataFrame 的值反向除以另一个 DataFrame 的值 |
sample() | 返回随机选择的元素 |
sem() | 返回指定轴中平均值的标准误 |
select_dtypes() | 返回一个 DataFrame,其中包含选定数据类型的列 |
shape | 返回 DataFrame 的行数和列数 |
set_axis() | 设置指定轴的索引 |
set_flags() | 返回一个具有指定标志的新 DataFrame |
set_index() | 设置 DataFrame 的索引 |
size | 返回 DataFrame 中的元素数量 |
skew() | 返回指定轴中值的偏度 |
sort_index() | 根据标签对 DataFrame 进行排序 |
sort_values() | 根据值对 DataFrame 进行排序 |
squeeze() | 将单列 DataFrame 转换为 Series |
stack() | 将 DataFrame 从宽表重塑为长表 |
std() | 返回指定轴上值的标准差 |
sum() | 返回指定轴上值的总和 |
sub() | 用指定的值减去 DataFrame 的值 |
swaplevel() | 交换两个指定的级别 |
T | 将行转换为列,将列转换为行 |
tail() | 返回标题和最后几行 |
take() | 返回指定的元素 |
to_xarray() | 返回一个 xarray 对象 |
transform() | 对 DataFrame 中的每个值执行函数 |
transpose() | 将行转换为列,将列转换为行 |
truediv() | 将 DataFrame 的值与指定的值相除 |
truncate() | 移除指定值集之外的元素 |
update() | 用另一个 DataFrame 的值更新一个 DataFrame |
value_counts() | 返回唯一行的数量 |
values | 将 DataFrame 返回为 NumPy 数组 |
var() | 返回指定轴上值的方差 |
where() | 替换所有满足指定条件为 False 的值 |
xs() | 返回 DataFrame 的横截面 |
__iter__() | 返回信息轴的迭代器 |