作为一名R用户,我还想了解scikit的最新情况.

创建一个线性回归模型是可以的,但似乎找不到一个合理的方法来得到standard summary of regression output.

代码示例:

# Linear Regression
import numpy as np
from sklearn import datasets
from sklearn.linear_model import LinearRegression

# Load the diabetes datasets
dataset = datasets.load_diabetes()

# Fit a linear regression model to the data
model = LinearRegression()
model.fit(dataset.data, dataset.target)
print(model)

# Make predictions
expected = dataset.target
predicted = model.predict(dataset.data)

# Summarize the fit of the model
mse = np.mean((predicted-expected)**2)
print model.intercept_, model.coef_, mse, 
print(model.score(dataset.data, dataset.target))

问题:

  • 似乎interceptcoef都内置在模型中,我只需输入print(倒数第二行)就可以看到它们.
  • 如果我正确地阅读了这些例子,你需要为每一个写一个函数/方程,然后打印出来.
  • 那么,对于lin.reg,是否没有标准的摘要输出.模型?
  • 另外,在我打印的系数输出数组中,有没有一种方法可以打印这些系数,在这里我可以得到系数的输出和它们所伴随的变量?

我的打印输出:

LinearRegression(copy_X=True, fit_intercept=True, normalize=False)
152.133484163 [ -10.01219782 -239.81908937  519.83978679  324.39042769 -792.18416163
  476.74583782  101.04457032  177.06417623  751.27932109   67.62538639] 2859.69039877
0.517749425413

注:从线性、脊和套索开始.我已经看过这些例子了.以下是基本的OLS.

推荐答案

sklearn中不存在R型回归总结报告.主要原因是sklearn用于预测建模/机器学习,判断标准基于之前未看到的数据(如回归的预测r^2)的性能.

确实存在一个名为sklearn.metrics.classification_report的分类汇总函数,用于计算分类模型上的几种类型(预测)分数.

要了解更classic 的统计方法,请看statsmodels.

R相关问答推荐

当我们有多个特殊字符时,使用gsub删除名称和代码'

如何编辑gMarginal背景以匹配绘图背景?

将饼图插入条形图

在rpart. plot或fancyRpartPlot中使用带有下标的希腊字母作为标签?

将重复项转换为NA

SHINY:使用JS函数应用的CSS样式显示HTML表格

根据另一列中的值和条件查找新列的值

R中Gamma回归模型均方误差的两种计算方法不一致

警告消息";没有非缺失的参数到min;,正在返回数据中的inf";.表分组集

提高圣彼得堡模拟的速度

创建列并对大型数据集中的特定条件进行成对比较的更高效程序

使用ggplot2中的sec_axis()调整次轴

将多个列合并为一个列的有效方法是什么?

有毒元素与表观遗传年龄的回归模型

名字的模糊匹配

Ggplot2如何找到存储在对象中的残差和拟合值?

有没有办法更改ggplot2中第二个y轴的比例限制?

将日期列从字符转换为日期得到的结果是NAS

从字符串列中的向量中查找第一个匹配的单词

使用循环改进功能( struct 简单)