在逻辑回归中,拟合了回归曲线y = f(x)。在回归曲线方程中,y是类别变量。该回归模型用于预测y给定了一组预测变量x。因此,预测变量可以是分类的,连续的或两者的混合。
逻辑回归是一种属于非线性回归的分类算法。该模型用于将给定的二进制结果(1/0,yes/no,true/false)预测为一组独立变量。
Logistic回归是一种回归模型,其中响应变量具有分类值,例如true/false或0/1。因此,我们可以测量二进制响应的概率。
链接:https://www.learnfk.comhttps://www.learnfk.com/R/r-logistic-regression.html
来源:LearnFk无涯教程网
有以下用于逻辑回归的数学方程式:
y=1/(1+e^-(b0+b1 x1+b2 x2+⋯))
在上式中,y是响应变量,x是预测变量,b0 and b1, b2,...bn是系数,是数字常数。我们使用glm()函数创建回归模型。
glm()函数具有以下语法。
glm(formula, data, family)
这里,
formula - 它是一个表示变量与变量之间的关系的符号。
data - 它是提供变量值的数据集。
family - 一个R对象,用于指定模型的详细信息,其值是用于逻辑回归的二项式。
在我们的示例中,我们将使用R环境中可用的数据集" BreastCancer"。要使用它,我们首先需要安装" mlbench"和" caret"软件包。
示例
#加载库 library(mlbench) #使用 BreastCancer 数据 data(BreastCancer, package = "mlbench") breast_canc = BreastCancer[complete.cases(BreastCancer),] #显示与str() 函数的数据集相关的信息。 str(breast_canc)
输出:
现在,我们将数据分为训练集和测试集,训练集包含70%的数据,测试集包括剩余的百分比。
# 将数据集分成培训和测试数据集。 set.seed(100) # 创建分区。 Training_Ratio <- createDataPartition(b_canc$Class, p=0.7, list = F) # 创建训练数据。 Training_Data <- b_canc[Training_Ratio, ] str(Training_Data) # 创建测试数据。 Test_Data <- b_canc[-Training_Ratio, ] str(Test_Data)
输出:
现在,我们借助glm()函数构造逻辑回归函数。我们将公式 Class〜Cell.shape 作为第一个参数,并将属性族指定为" binomial ",并使用Training_data作为第三个参数。
示例
# 创建回归模型 glm(Class ~ Cell.shape, family="binomial", data = Training_Data)
输出:
现在,使用摘要函数进行分析。
# 创建回归模型 model<-glm(Class ~ Cell.shape, family="binomial", data = Training_Data) # 使用summary函数 print(summary(model))
输出:
祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)