AdaBoost函数

首页 / 机器学习入门教程 / AdaBoost函数

它是最成功的增强集成算法之一。该算法的主要关键在于它们对数据集中的赋予权重的方式。因此,在构建后续模型时,该算法无需过多关注。

在以下Python配方中,我们将通过使用Pima Indians糖尿病数据集上的 sklearn 的 AdaBoostClassifier 类来构建用于分类的Ada Boost集成模型。

链接:https://www.learnfk.comhttps://www.learnfk.com/python-machine-learning/machine-learning-with-python-adaboost.html

来源:LearnFk无涯教程网

首先,导入所需的软件包,如下所示:

from pandas import read_csv
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
from sklearn.ensemble import AdaBoostClassifier

现在,我们需要像之前的Example一样加载Pima糖尿病数据集-

path=r"C:\pima-indians-diabetes.csv"
headernames=['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data=read_csv(path, names=headernames)
array=data.values
X=array[:,0:8]
Y=array[:,8]

接下来,输入用于十折交叉验证的输入,如下所示:

seed=5
kfold=KFold(n_splits=10, random_state=seed)

我们需要提供要建造的树木数量。在这里,我们正在构建150棵树木,这些树木的分裂点是从5个特征中选择的-

num_trees=50

接下来,在以下脚本的帮助下构建模型-

model=AdaBoostClassifier(n_estimators=num_trees, random_state=seed)

计算并打印输出如下-

results=cross_val_score(model, X, Y, cv=kfold)
print(results.mean())

输出

无涯教程网

0.7539473684210527

上面的输出表明,我们的AdaBoost分类器集成模型的准确度约为75%。

这一章《Python机器学习 - AdaBoost函数》你学到了什么?在下面做个笔记吧!做站不易,你的分享是对我们最大的支持

好记忆不如烂笔头。留下你的足迹吧 :)

相关推荐

玩转webpack -〔程柳锋 - 〕

分布式协议与算法实战 -〔韩健 - 〕

SRE实战手册 -〔赵成 - 〕

说透数字化转型 -〔付晓岩 - 〕

如何在 Python 中加载 Bloomberg Live 曲线

Python:如何在函数中键入提示 tf.keras 对象?

为什么 Python 的 sqlite3 模块不尊重位置参数的顺序?

如何在numpy中将图像(28,28,1)转换为(28,28,3)

记录 Snakemake 自己的控制台输出 - 如何更改 Snakemake 记录到的文件?

如何在知道起始坐标、线长 x Angular 和 y、Angular 的情况下画线

视频推荐

Python机器学习 - 08-朴素贝叶斯算法对文本分类 更多视频教程 »