具有以下数据帧:
import pandas as pd
cars = ["BMV", "Mercedes", "Audi"]
customer = ["Juan", "Pepe", "Luis"]
price = [100, 200, 300]
year = [2022, 2021, 2020]
df_raw = pd.DataFrame(list(zip(cars, customer, price, year)),\
columns=["cars", "customer", "price", 'year'])
我需要对分类变量cars
和customer
进行一次热编码,为此,我对这两列使用get_dummies方法.
numerical = ["price", "year"]
df_final = pd.concat([df_raw[numerical], pd.get_dummies(df_raw.cars),\
pd.get_dummies(df_raw.customer)], axis=1)
有没有一种方法可以动态生成这些假人,比如把它们放在一个列表中,然后用for循环遍历它们.在这种情况下,它可能看起来很简单,因为我只有2个属性,但如果我有30或60个属性,我会一个接一个地go 吗?