关注我们

Python机器学习中的 Extra Trees函数

它是袋装决策树集成方法的另一种扩展。在这种方法中,从训练数据集的样本中构建随机树。

在以下Python食谱中,我们将通过在Pima Indians糖尿病数据集上使用sklearn的ExtraTreesClassifier类来构建额外的树集成模型。

首先,导入所需的软件包,如下所示:

from pandas import read_csv
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
from sklearn.ensemble import ExtraTreesClassifier

现在,我们需要像之前的Example一样加载Pima糖尿病数据集-

path=r"C:\pima-indians-diabetes.csv"
headernames=['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data=read_csv(path, names=headernames)
array=data.values
X=array[:,0:8]
Y=array[:,8]

接下来,输入用于十折交叉验证的输入,如下所示:

seed=7
kfold=KFold(n_splits=10, random_state=seed)

我们需要提供要建造的树木数量。在这里,我们正在构建150棵树木,这些树木的分裂点是从5个特征中选择的-

num_trees=150
max_features=5

接下来,在以下脚本的帮助下构建模型-

链接：https://www.learnfk.comhttps://www.learnfk.com/python-machine-learning/machine-learning-with-python-extra-trees.html

来源：LearnFk无涯教程网

model=ExtraTreesClassifier(n_estimators=num_trees, max_features=max_features)

计算并打印输出如下-

results=cross_val_score(model, X, Y, cv=kfold)
print(results.mean())

输出

0.7551435406698566

上面的输出显示,我们的袋装额外树木分类器模型的准确性约为75.5％。

祝学习愉快！(内容编辑有误？请选中要编辑内容 -> 右键 -> 修改 -> 提交！)

技术教程推荐

Kubernetes入门实战课 -〔罗剑锋〕

Web 3.0入局攻略 -〔郭大治〕

好记忆不如烂笔头。留下您的足迹吧 :)

Python机器学习 中的 Extra Trees函数

Python机器学习中的 Extra Trees函数