R 逻辑回归

R 逻辑回归 首页 / R入门教程 / R 逻辑回归

在逻辑回归中,拟合了回归曲线y = f(x)。在回归曲线方程中,y是类别变量。该回归模型用于预测y给定了一组预测变量x。因此,预测变量可以是分类的,连续的或两者的混合。

逻辑回归是一种属于非线性回归的分类算法。该模型用于将给定的二进制结果(1/0,yes/no,true/false)预测为一组独立变量。

Logistic回归是一种回归模型,其中响应变量具有分类值,例如true/false或0/1。因此,我们可以测量二进制响应的概率。

链接:https://www.learnfk.comhttps://www.learnfk.com/R/r-logistic-regression.html

来源:LearnFk无涯教程网

有以下用于逻辑回归的数学方程式:

     y=1/(1+e^-(b0+b1 x1+b2 x2+⋯))

在上式中,y是响应变量,x是预测变量,b0 and b1, b2,...bn是系数,是数字常数。我们使用glm()函数创建回归模型。

无涯教程网

glm()函数具有以下语法。

glm(formula, data, family)

这里,

formula  -  它是一个表示变量与变量之间的关系的符号。

data         -  它是提供变量值的数据集。

family      -  一个R对象,用于指定模型的详细信息,其值是用于逻辑回归的二项式。

建立逻辑回归

在我们的示例中,我们将使用R环境中可用的数据集" BreastCancer"。要使用它,我们首先需要安装" mlbench"和" caret"软件包。

示例

#加载库
library(mlbench)
#使用 BreastCancer 数据
data(BreastCancer, package = "mlbench")
breast_canc = BreastCancer[complete.cases(BreastCancer),]
#显示与str() 函数的数据集相关的信息。
str(breast_canc)

输出:

R Logistic Regression

现在,我们将数据分为训练集和测试集,训练集包含70%的数据,测试集包括剩余的百分比。

# 将数据集分成培训和测试数据集。
set.seed(100)  
# 创建分区。
Training_Ratio <- createDataPartition(b_canc$Class, p=0.7, list = F)  
# 创建训练数据。
Training_Data <- b_canc[Training_Ratio, ]  
str(Training_Data)  
# 创建测试数据。 
Test_Data <- b_canc[-Training_Ratio, ]  
str(Test_Data)  

输出:

R Logistic Regression

现在,我们借助glm()函数构造逻辑回归函数。我们将公式 Class〜Cell.shape 作为第一个参数,并将属性族指定为" binomial ",并使用Training_data作为第三个参数。

示例

# 创建回归模型
glm(Class ~ Cell.shape, family="binomial", data = Training_Data)

输出:

R Logistic Regression

现在,使用摘要函数进行分析。

# 创建回归模型
model<-glm(Class ~ Cell.shape, family="binomial", data = Training_Data)  
# 使用summary函数
print(summary(model))  

输出:

R Logistic Regression

祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)

技术教程推荐

趣谈网络协议 -〔刘超〕

JavaScript核心原理解析 -〔周爱民〕

Selenium自动化测试实战 -〔郭宏志〕

A/B测试从0到1 -〔张博伟〕

操作系统实战45讲 -〔彭东〕

遗留系统现代化实战 -〔姚琪琳〕

现代React Web开发实战 -〔宋一玮〕

结构沟通力 -〔李忠秋〕

Rust 语言从入门到实战 -〔唐刚〕

好记忆不如烂笔头。留下您的足迹吧 :)