我有一个2列的DataFrame,‘id’和‘recordhash’,我用它来比较记录.我可以使用以下命令获取与‘recordhash’匹配的记录列表:
dups = df[df['recordhash'].duplicated(keep=False).sort_values('recordhash')
个
但它们的输出为:
id recordhash
------------------
1 ab15
10 ab15
我想将它们显示为:
matching recordhash
---------------------
1, 10 ab15
这看起来很简单,但我一直没有找到它.