我想拟合一个逻辑回归模型,用X1和X2预测Y.

x_train, x_test, y_train, y_test = train_test_split(X,Y,test_size)

然后

model = LogisticRegression()
model.fit(x_train,y_train)

要使用X预测Y,我不知道如何使用多个预测器来训练数据.需要帮忙吗?

推荐答案

如果有2个特征X1X2,则训练数据X将有2列.例如,如果数据有X10 X1X10 X2,则X的形状应为(X10 x 2)

例如,您有一个包含3列的csv文件:X1X2y

import pandas as pd
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

df = pd.read_csv('my_file.csv')
X = df[['X1', 'X2']]
Y = df['y']

x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size=0.2)
model = LogisticRegression()
model.fit(x_train,y_train)

y_pred = model.predict(x_test)

acc = accuracy_score(y_test, y_pred)

Python相关问答推荐

如何修复fpdf中的线路出血

Snap 7- read_Area用于类似地址的变量

带有pandas的分区列上的过滤器的多个条件read_parquet

GEKKO:已知延迟的延迟系统的参数估计

如何在不使用字符串的情况下将namedtuple属性传递给方法?

Python:记录而不是在文件中写入询问在多文件项目中记录的最佳实践

是pandas.DataFrame使用方法查询后仍然排序吗?

如何从具有多个嵌入选项卡的网页中Web抓取td类元素

如何在箱形图中添加绘制线的传奇?

try 在树叶 map 上应用覆盖磁贴

2D空间中的反旋算法

优化pytorch函数以消除for循环

' osmnx.shortest_track '返回有效源 node 和目标 node 的'无'

Mistral模型为不同的输入文本生成相同的嵌入

OR—Tools中CP—SAT求解器的IntVar设置值

Python—从np.array中 Select 复杂的列子集

如果满足某些条件,则用另一个数据帧列中的值填充空数据帧或数组

Python中的变量每次增加超过1

使用Python和文件进行模糊输出

以逻辑方式获取自己的pyproject.toml依赖项