4.最小二乘法线性拟合(非常好)
我们知道,用作图法求出直线的斜率a和截据b,可以确定这条直线所对应的经验公式,但用作图法拟合直线时,由于作图连线有较大的随意性,尤其在测量数据比较分散时,对同一组测量数据,不同的人去处理,所得结果有差异,因此是一种粗略的数据处理方法,求出的a和b误差较大。用最小二乘法拟合直线处理数据时,任何人去处理同一组数据,只要处理过程没有错误,得到的斜率a和截据b是唯一的。 最小二乘法就是将一组符合Y=a+bX关系的测量数据,用计算的方法求出最佳的a和b。显然,关键是如何求出最佳的a和b。
(1) 求回归直线
设直线方程的表达式为:
(2-6-1)
要根据测量数据求出最佳的a和b。对满足线性关系的一组等精度测量数据(xi,yi),假定自变量xi的误差可以忽略,则在同一xi下,测量点yi和直线上的点a+bxi的偏差di如下:
显然最好测量点都在直线上(即d1=d2=……=dn=0),求出的a和b是最理想的,但测量点不可能都在直线上,这样只有考虑d1、d2、……、dn为最小,也就是考虑d1+d2+……+dn为最小,但因d1、d2、……、dn有正有负,加起来可能相互抵消,因此不可取;而|d1|+ |d2|+……+ |dn|又不好解方程,因而不可行。现在采取一种等效方法:当d12+d22+……+dn2对a和b为最小时,d1、d2、……、dn也为最小。取(d12+d22+……+dn2)为最小值,求a和b的方法叫最小二乘法。
令 = (2-6-2)
D对a和b分别求一阶偏导数为:
再求二阶偏导数为:
;
显然: ;
满足最小值条件,令一阶偏导数为零:
(2-6-3)
(2-6-4)
引入平均值:; ;
;
则:
(2-6-5)
解得: (2-6-6)
(2-6-7)
将a、b值带入线性方程,即得到回归直线方程。
(2) y、a、b的标准差
在最小二乘法中,假定自变量误差可以忽略不计,是为了方便推导回归方程。操作中函数的误差大于自变量的误差即可认为满足假定。实际上两者均是变量,都有误差,从而导致结果y、a、b的标准差(n≥6)如下:
(2-6-8)
(根式的分母为n-2,是因为有两个变量)
(2-6-9)
(2-6-10)
(3)相关系数
相关系数是衡量一组测量数据xi、yi线性相关程度的参量,其定义为:
(2-6-11)
r值在0<|r|≤1中。 |r|越接近于1,x 、y 之间线性好;r为正,直线斜率为正,称为正相关;r为负,直线斜率为负,称为负相关。|r|接近于0,则测量数据点分散或xi、yi之间为非线性。不论测量数据好坏都能求出a和b,所以我们必须有一种判断测量数据好坏的方法,用来判断什么样的测量数据不宜拟合,判断的方法是|r|<r时,测量数据是非线性的.r称为相关系数的起码值,与测量次数n有关,如下表2-6-2
表2-6-2 相关系数起码值r
n | r | n | r | n | r |
3 | 1.000 | 9 | 0.798 | 15 | 0.641 |
4 | 0.990 | 10 | 0.765 | 16 | 0.623 |
5 | 0.959 | 11 | 0.735 | 17 | 0.606 |
6 | 0.917 | 12 | 0.708 | 18 | 0.590 |
7 | 0.874 | 13 | 0.684 | 19 | 0.575 |
8 | 0.834 | 14 | 0.661 | 20 | 0.561 |
| | | | | |
在进行一元线性回归之前应先求出r值,再与r比较,若|r|> r,则x和y具有线性关系,可求回归直线;否则反之。
例9:灵敏电流计的电流常数Ki和内阻Rg的测量公式为测得的数据同例7,其中间处理过程如下,试用最小二乘法求出Ki和Rg,并写出回归方程的表达式。
解:测量公式与线性方程表达式y=a+bx比较:
数据处理如表2-6-3:
表2-6-3 Rs=0.100Ω R1=4350.0Ω d=40.0mm
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 平均值 |
| | | | | | | | | |
R2(Ω) | 400.0 | 350.0 | 300.0 | 250.0 | 200.0 | 150.0 | 100.0 | 50.0 | 225.0 |
U(V) | 2.82 | 2.49 | 2.15 | 1.82 | 1.51 | 1.18 | 0.84 | 0.56 | 1.67125 |
(104Ω2) | 16.00 | 12.25 | 9.000 | 6.250 | 4.000 | 2.250 | 1.000 | 0.250 | 6.375 |
U2(V2) | 7.95 | 6.20 | 4.62 | 3.31 | 2.28 | 1.39 | 0.71 | 0.31 | 3.34625 |
R2U(102ΩV) | 11.3 | 8.72 | 6.45 | 4.55 | 3.02 | 1.77 | 0.84 | 0.28 | 4.615625 |
| | | | | | | | | |
中间过程可多取位:
=1.67125 =225.0 =3.34625 =6.375×10拟合直线4 =461.5625
相关系数
查表得知,当n=8时,r0=0.834,两者比较r>r0,说明x、y(即U、R2)之间线性相关,可以求回归直线。
求回归方程的系数
=154.6192304
=-33.4
代换
=33.4Ω
=154.6192304
Ki==3.7170×10-9A/mm
计算标准差为:
=2.64561902; =2.300545589; =1.257626418
计算不确定度:
ΔRg==2Ω; ==0.81%; ΔK =0.03×10-9A/mm
测量结果表达式