我有一个Pandas 数据帧,它由一个ID和不同编码单词的相关计数组成.例如:
Original = pd.DataFrame(data=[[1,'1:2,2:3,3:1'],[2,'2:2,4:3']], columns=['id','words'])
我有一个词典,它有到实际单词的映射,例如:
WordDict = {1:'A',2:'B',3:'C',4:'D'}
我想要做的是创建一个新的数据帧,它将计数映射到所有可能单词的列,因此它看起来如下所示:
Final =pd.DataFrame(data=[[1,2,3,1,0],[2,0,2,0,3]], columns=['id','A','B','C','D']).set_index('id')
我知道我可以将原始文档的"Words"列拆分成多个单独的列,并且可以从WordDict创建一个数据帧,这样它就可以包含所有可能的列,但我不知道如何创建映射.