我正在处理我的实验室测量数据,这些数据与测量声速有关.简单地说,我有一系列的y(x)项指标如下:

x       y
0       0
1     212
2     426
3     640
4     858
5    1074
6    1290
7    1506
8    1722
9    1939

我还知道y的测量值可能会偏离2.所以,例如,x = 1,y可能在210到214之间.我想知道这个误差对线性回归系数有多大的影响.

我用的是sklearn-LinearRegression,有了fit_intercept=False参数,任务就不那么难了.我只需要计算y - 2y + 2系列的系数,然后得到差值.但是,我必须在没有fit_intercept=False的情况下执行类似的任务(因此,当x为0时,y不是0).

所以我想知道有什么正式实施的方法来实现我的目标吗?不一定是sklearn年.

推荐答案

y = mx + c中的斜率系数m如下所示.(我怀疑你只需要斜率就可以从你的数据中获得音速.)

(Case 1)如果允许非零截距c,则斜率为:

enter image description here

分母是正数.(它是x的方差的N倍).

要获得要最大化的最大坡度,请执行以下操作:

enter image description here

所以,take the greatest possible value of 100 if 101 is greater than 102 and the smallest value of 100 if 101 is less than x_mean.

为了得到最小斜率,则通过反转来最小化分子.

(Case 2)如果截距c被强制为零(直线必须通过原点),则斜率为:

enter image description here

由于x个值是固定的,那么maximize the slope by taking the largest possible value of 101 where 100 is positive and the smallest possible value when 100 is negative个.同样,反之亦然,以获得最小坡度.

Python相关问答推荐

如何才能知道Python中2列表中的巧合.顺序很重要,但当1个失败时,其余的不应该失败或是0巧合

SQLGory-file包FilField不允许提供自定义文件名,自动将文件保存为未命名

抓取rotowire MLB球员新闻并使用Python形成表格

如何从具有不同len的列表字典中创建摘要表?

如何制作10,000年及以后的日期时间对象?

计算组中唯一值的数量

有没有一种方法可以从python的pussompy比较结果中提取文本?

Pandas—在数据透视表中占总数的百分比

旋转多边形而不改变内部空间关系

如何在Pyplot表中舍入值

pysnmp—lextudio使用next()和getCmd()生成器导致TypeError:tuple对象不是迭代器''

jsonschema日期格式

如何使用Azure Function将xlsb转换为xlsx?

在我融化极点数据帧之后,我如何在不添加索引的情况下将其旋转回其原始形式?

如何训练每一个pandaprame行的线性回归并生成斜率

如果不使用. to_list()[0],我如何从一个pandas DataFrame中获取一个值?

如何通过特定导入在类中执行Python代码

关于数字S种子序列内部工作原理的困惑

对列中的数字进行迭代,得到n次重复开始的第一个行号

为什么这个正则表达式没有捕获最后一次输入?