菜单
×
   ❮     
HTML CSS JAVASCRIPT SQL PYTHON JAVA PHP HOW TO W3.CSS C C++ C# BOOTSTRAP REACT MYSQL JQUERY EXCEL XML DJANGO NUMPY PANDAS NODEJS R TYPESCRIPT ANGULAR GIT POSTGRESQL MONGODB ASP AI GO KOTLIN SASS VUE DSA GEN AI SCIPY AWS CYBERSECURITY DATA SCIENCE
     ❯   

Pandas DataFrame drop_duplicates() 方法

❮ DataFrame 参考


示例

从 DataFrame 中移除重复行 

import pandas as pd

data = {
"name": ["Sally", "Mary", "John", "Mary"],
  "age": [50, 40, 30, 40],
  "qualified": [True, False, False, False]
}

df = pd.DataFrame(data)

newdf = df.drop_duplicates()
自己动手试一试 »

定义和用法

drop_duplicates() 方法会移除重复的行。

如果只想根据特定列来查找重复项,请使用 subset 参数。


语法

dataframe.drop_duplicates(subset, keep, inplace, ignore_index)

参数

参数是 关键字参数

参数 描述
subset 列标签 可选。一个字符串或一个列表,包含查找重复项时要使用的列。如果未指定,则使用所有列。
keep 'first'
'last'
False
可选,默认为 'first'。指定保留哪个重复项。如果为 False,则删除所有重复项。
inplace True
False
可选,默认为 `False`。如果为 `True`:则在当前 DataFrame 上执行删除操作。如果为 `False`:则返回一个已执行删除操作的副本。
ignore_index True
False
可选,默认为 False。指定是否为 0、1、2 等进行标签化,或者不进行标签化。

返回值

一个带有结果的DataFrame,如果 inplace 参数设置为 True,则为 None。


❮ DataFrame 参考

×

联系销售

如果您想将 W3Schools 服务用于教育机构、团队或企业,请发送电子邮件给我们
sales@w3schools.com

报告错误

如果您想报告错误,或想提出建议,请发送电子邮件给我们
help@w3schools.com

W3Schools 经过优化,旨在方便学习和培训。示例可能经过简化,以提高阅读和学习体验。教程、参考资料和示例会不断审查,以避免错误,但我们无法保证所有内容的完全正确性。使用 W3Schools 即表示您已阅读并接受我们的使用条款Cookie 和隐私政策

版权所有 1999-2024 Refsnes Data。保留所有权利。W3Schools 由 W3.CSS 提供支持