我有一个用Python语言编写的Pandas 数据帧,其中包含以下两列.
我需要计算在考虑和不考虑顺序的情况下,数据组合的对和三元组出现的次数.例如,假设我有一个包含两列(Classification
和Individual
)和以下令牌数据的数据帧
data = {
'Classification': [1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5],
'Individual': ['A', 'A', 'B', 'B', 'A', 'A', 'B', 'C', 'C', 'C', 'A', 'A', 'A', 'B', 'B', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C', 'A', 'A', 'B', 'B', 'B']
}
现在,我想得出以下结果
Clasification ValueSeries TimesClassification PercentageClassification
1 AB 5 1
2 AB 5 1
3 AC 2 0.4
3 AB 5 1
3 ABC 3 0.6
4 AB 5 1
4 BC 2 0.4
4 ABC 3 0.6
5 AC 2 0.4
5 AB 5 1
5 ABC 3 0.6
这是对于每个分类的值,包含在其中的无序号的对和三联体.