Python3.x 如何转换Pandas中的数据，以使我 Select 的列名变为行值并增加行

发布于01月23日

我有一个很大的数据集，如下所示:

CUSTOMER ID	Apples	Oranges	Bananas	Pineapple	Other Items
CUST_123	Yes	Yes	No	No	No
CUST_456	No	Yes	No	Yes	No
CUST_789	No	No	No	No	Yes

我想做的是，让它有以下格式:

CUSTOMER ID	Item
CUST_123	Apples
CUST_123	Oranges
CUST_456	Oranges
CUST_456	Pineapple
CUST_789	Other Item

你知道我怎么才能把它变成这样吗？数据集是相当大的，认为10,000条记录很容易，至少有10-15个类别的布局如表1所示.我需要在表2的格式.

我已经try 了这里分享的方法https://stackoverflow.com/questions/28654047/convert-columns-into-rows-with-pandas，但我认为我没有正确使用熔化，或者这不是正确的方式来获得想要的结果.如果能给我一些指导/建议，我将不胜感激.

推荐答案

Code个

使用melt

out = (df.melt('CUSTOMER ID', var_name='Item')
         .query('value == "Yes"')
         .drop('value', axis=1))

输出:

   CUSTOMER ID         Item
0     CUST_123       Apples
3     CUST_123      Oranges
4     CUST_456      Oranges
10    CUST_456    Pineapple
14    CUST_789  Other Items

Example Code个

import pandas as pd
data1 = {'CUSTOMER ID': ['CUST_123', 'CUST_456', 'CUST_789'], 
         'Apples': ['Yes', 'No', 'No'], 'Oranges': ['Yes', 'Yes', 'No'], 
         'Bananas': ['No', 'No', 'No'], 'Pineapple': ['No', 'Yes', 'No'], 
         'Other Items': ['No', 'No', 'Yes']}
df = pd.DataFrame(data1)