我有一个数据帧,看起来是这样的:
label predicted F1 F2 F3 .... F40
major minor 2 1 4
major major 1 0 10
minor patch 4 3 23
major patch 2 1 11
minor minor 0 4 8
patch major 7 3 30
patch minor 8 0 1
patch patch 1 7 11
我有label
,这是id
的真实标签(没有显示,因为它不相关),predicted
标签,然后在我的DF中设置了大约40个功能.
我们的 idea 是将这40个特征转换成2个维度,并将它们与预测的真实情况可视化.与他们的预测相比,major
、minor
和patch
这三个标签都有9个 case .
对于主成分分析,它不能捕捉两个分量的很大差异,我不确定如何将PCA值与原始DF中的标签和预测作为一个整体进行映射.实现这一点的一种方法是将所有 case 分成9个数据帧并实现结果,但这不是我想要的.
有没有其他方法可以减少和可视化给定的数据?任何建议都将受到高度赞赏.