我有一个这样的DataFrame:
import pandas as pd
df = pd.DataFrame({'id':[1,2,3,4,5,6,7,8,9,10], 'name': ['mary','mary','mary','tom','tom','john','sarah','tom','tom','tom'], 'age': [30,30,30,25,25,28,36,25,25,25]})
id name age
0 1 mary 30
1 2 mary 30
2 3 mary 30
3 4 tom 25
4 5 tom 25
5 6 john 28
6 7 sarah 36
7 8 tom 25
8 9 tom 25
9 10 tom 25
它上有多个重复的行(不考虑‘id’列).
我只想删除尾部重复的行,保留第一行(不考虑‘id’列).
我希望得到这样的消息:
id name age
0 1 mary 30
1 2 mary 30
2 3 mary 30
3 4 tom 25
4 5 tom 25
5 6 john 28
6 7 sarah 36
7 8 tom 25
我找不到使用DROP_DUPLICATES解决这个问题的方法.