作为一名R用户,我还想了解scikit的最新情况.
创建一个线性回归模型是可以的,但似乎找不到一个合理的方法来得到standard summary of regression output.
代码示例:
# Linear Regression
import numpy as np
from sklearn import datasets
from sklearn.linear_model import LinearRegression
# Load the diabetes datasets
dataset = datasets.load_diabetes()
# Fit a linear regression model to the data
model = LinearRegression()
model.fit(dataset.data, dataset.target)
print(model)
# Make predictions
expected = dataset.target
predicted = model.predict(dataset.data)
# Summarize the fit of the model
mse = np.mean((predicted-expected)**2)
print model.intercept_, model.coef_, mse,
print(model.score(dataset.data, dataset.target))
问题:
- 似乎intercept和coef都内置在模型中,我只需输入
print
(倒数第二行)就可以看到它们. - 如果我正确地阅读了这些例子,你需要为每一个写一个函数/方程,然后打印出来.
- 那么,对于lin.reg,是否没有标准的摘要输出.模型?
- 另外,在我打印的系数输出数组中,有没有一种方法可以打印这些系数,在这里我可以得到系数的输出和它们所伴随的变量?
我的打印输出:
LinearRegression(copy_X=True, fit_intercept=True, normalize=False)
152.133484163 [ -10.01219782 -239.81908937 519.83978679 324.39042769 -792.18416163
476.74583782 101.04457032 177.06417623 751.27932109 67.62538639] 2859.69039877
0.517749425413
注:从线性、脊和套索开始.我已经看过这些例子了.以下是基本的OLS.