Python pandas：来自 get_dummies 的动态连接

发布于05月12日

具有以下数据帧:

import pandas as pd

cars = ["BMV", "Mercedes", "Audi"]
customer = ["Juan", "Pepe", "Luis"]
price = [100, 200, 300]
year = [2022, 2021, 2020]


df_raw = pd.DataFrame(list(zip(cars, customer, price, year)),\
                      columns=["cars", "customer", "price", 'year'])

我需要对分类变量cars和customer进行一次热编码，为此，我对这两列使用get_dummies方法.

numerical = ["price", "year"]
df_final = pd.concat([df_raw[numerical], pd.get_dummies(df_raw.cars),\
                      pd.get_dummies(df_raw.customer)], axis=1)

有没有一种方法可以动态生成这些假人，比如把它们放在一个列表中，然后用for循环遍历它们.在这种情况下，它可能看起来很简单，因为我只有2个属性，但如果我有30或60个属性，我会一个接一个地go 吗？

`警察局.找些傻瓜`

警察局.找些傻瓜(df_raw, columns=['cars', 'customer'])

   price  year  cars_Audi  cars_BMV  cars_Mercedes  customer_Juan  customer_Luis  customer_Pepe
0    100  2022          0         1              0              1              0              0
1    200  2021          0         0              1              0              0              1
2    300  2020          1         0              0              0              1              0