我已经完成了scikit-learn
模型的训练,并将其保存为pickle
文件.现在我想加载模型并运行预测,但我不知道如何预处理输入数据.
dataset = {
'airline': ['SpiceJet', 'Indigo', 'Air_India']
}
df = pd.DataFrame.from_dict(dataset)
airline
列有3条航线,用于创建具有以下代码的虚拟列:
def preprocessing(df):
dummies = pd.get_dummies(df["airline"], drop_first=True)
return dummies
用于训练的数据集将具有如下模式:
| airline_SpiceJet | airline_Indigo | airline_Air_India |
我的问题是关于下面的输入,如何将输入映射到相应的列?
input = {
'airline': ['SpiceJet']
}
数据集的预期输出:
| airline_SpiceJet | airline_Indigo | airline_Air_India |
| ---------------- | -------------- | ----------------- |
| 1 | 0 | 0 |