DataFrame.drop_duplicates函数

DataFrame.drop_duplicates函数 首页 / Pandas入门教程 / DataFrame.drop_duplicates函数

drop_duplicates()函数执行常见的数据清理任务,该任务处理DataFrame中的重复值。此方法有助于从DataFrame中删除重复的值。

语法

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

参数

  • subset       -   它需要一列或列标签列表。默认值None。
  • keep           -   它用于控制如何考虑重复值。它具有三个不同的值,如下所示:
    • first   - 它会删除除第一个匹配项之外的重复值。
    • last    - 删除最后一次出现的重复值。
    • False - 它将删除所有重复项。
  • inplace     -  返回布尔值。默认值为False。如果为true,则删除具有重复值的行。

返回

根据传递的参数,它返回删除了重复行的DataFrame。

链接:https://www.learnfk.comhttps://www.learnfk.com/pandas/pandas-dataframe-drop-duplicates.html

来源:LearnFk无涯教程网

例子

import pandas as pd
emp = {"Name": ["Parker", "Learnfk", "William", "Parker"],
"Age": [21, 32, 29, 21]}
info = pd.DataFrame(emp)
print(info)

输出

        Name     Age
0     Parker     21
1     Learnfk      32
2     William    29
3     Parker     21
import pandas as pd
emp = {"Name": ["Parker", "Learnfk", "William", "Parker"],
"Age": [21, 32, 29, 21]}
info = pd.DataFrame(emp)
info = info.drop_duplicates()
print(info)

输出

       Name    Age
0    Parker    21
1    Learnfk     32
2    William   29

祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)

技术教程推荐

快速上手Kotlin开发 -〔张涛〕

Android开发高手课 -〔张绍文〕

黄勇的OKR实战笔记 -〔黄勇〕

现代C++编程实战 -〔吴咏炜〕

Redis核心技术与实战 -〔蒋德钧〕

高楼的性能工程实战课 -〔高楼〕

AI绘画核心技术与实战 -〔南柯〕

程序员职业规划手册 -〔雪梅〕

工程师个人发展指南 -〔李云〕

好记忆不如烂笔头。留下您的足迹吧 :)