Stochastic Gradient Boosting函数

首页 / 机器学习 / Stochastic Gradient Boosting函数

它也称为梯度提升机。在下面的Python食谱中,我们将通过使用pima Indians糖尿病数据集上的 sklearn 的 GradientBoostingClassifier 类来创建随机梯度Boostingensemble模型进行分类。

首先,导入所需的软件包,如下所示:

from pandas import read_csv
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
from sklearn.ensemble import GradientBoostingClassifier

现在,我们需要像之前的Example一样加载Pima糖尿病数据集-

path=r"C:\pima-indians-diabetes.csv"
headernames=['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data=read_csv(path, names=headernames)
array=data.values
X=array[:,0:8]
Y=array[:,8]

接下来,输入用于十折交叉验证的输入,如下所示:

seed=5
kfold=KFold(n_splits=10, random_state=seed)

我们需要提供要建造的树木数量。在这里,我们正在构建150棵树木,这些树木的分裂点是从5个特征中选择的-

无涯教程网

num_trees=50

接下来,在以下脚本的帮助下构建模型-

链接:https://www.learnfk.comhttps://www.learnfk.com/python-machine-learning/machine-learning-with-python-stochastic-gradient-boosting.html

来源:LearnFk无涯教程网

model=GradientBoostingClassifier(n_estimators=num_trees, random_state=seed)

计算并打印输出如下-

results=cross_val_score(model, X, Y, cv=kfold)
print(results.mean())

输出

0.7746582365003418

上面的输出显示,我们的Gradient Boosting分类器集成模型的准确性约为77.5%。

这一章《Python机器学习 - Stochastic Gradient Boosting函数》你学到了什么?在下面做个笔记吧!做站不易,你的分享是对我们最大的支持

好记忆不如烂笔头。留下你的足迹吧 :)

相关文章

技术领导力实战笔记 -〔TGO鲲鹏会 - 〕

如何做好一场技术演讲 -〔极客时间 - 〕

DDD实战课 -〔欧创新 - 〕

中间件核心技术与实战 -〔丁威 - 〕

将函数输出作为输入参数反馈给它

让 Black Python 代码格式化程序对齐注释

根据另一列中的多个条件填充列中的值(Python)

Pytorch 中的梯度下降重新分配

基于另一列的布尔值的累积和

什么是 ID 最合适/最有效的 pandas 数据类型?

视频推荐〔Python机器学习 - 05-facebook案例流程分析〕

更多 Machine-learning-with-python-stochastic-gradient-boosting 视频教程 »