关于计量经济模型中几个具体问题的研究

计量经济模型中若干具体问题的分析
摘 要:本文对计量经济模型中有无截距项、什么时候将时间变量T引入模型、t检验与F检验的关系、正相关的解释变量回归系数为什么会出现负数以及R2R2之间的关系等五个具体问题进行深入而系统的分析。
关键词:截距项;时间变量;假设检验;黄桥打会回归系数;拟合优度
一、对模型中有无截距项的选择作为经验法则,一般首先应建立有截距项的计量经济模型,除非有非常强的先验性预期,才建立无截距项的计量经济模型。这样做是基于以下考虑:第一,无截距项的计量经济模型相对于有截距项的计量经济模型存在许多异常性,因此,建立无截距项的模型要十分谨慎。以一元回归模型为例,Yi= B1+ B2Xi+ ui,当有截距项时,B2OLS估计量b2=∑xiyi∑x2i,var(b2) =σ2∑x2i,^σ2=∑e2in -2;而无截距项时计量经济学论文,B2OLS估计量~b2∑XiYi∑X2i,var(~b2)σ2∑X2i,^σ2=∑e2in -1。式中的xi= Xi-,yi= Yi--Y。显然,模型中有无截距项的差异,首先是斜率2OLS估计量不同,估计量的方差和随机扰项方差估计值也不同。其次是有截距项时,则有∑ei=0,而无截距项时银川市商业银行,∑ei=0不一定成立。再次是判定系数r2不同,在有截距项的模型中,r2的计算公式为r2=∑(xiyi)2∑x2i∑y2i,而在无截距项的模型中,r2的计算公式为:r2=∑(XiYi)2∑X2i∑Y2i(1)(1)式可由r2=1-RSSTSS=1-∑e2i∑y2i导出。在有截距项的模型中,
RSS =∑e2i=∑y2i-b2∑x2i≤∑y2i,RSS< TSS,或者说r2不可能为负值;而在无截距项的模型中,RSS =∑e2i=∑Y2i-~b2∑X2i,不能保证RSS一定小于TSS =∑y2i=∑Y2i- N-Y2,~b2∑X2i< N-Y2,存在RSS >TSS,此时由(1)式计算的r2为负值。在有截距项的多元回归模型中,R2的计算公式为:R2=1-e′eY′M0Y(2)定义:M0= I- i(i′i)-1i′= I-1nii′,式中i =(l,l,…,l)′n×1,M0Y = Y--Y,M0X = X--X,M0e= e对于Y= Xb+e(式中b =(X′X)-1X′Y),两边左乘M0,M0Y = M0Xb+ M0e = M0Xb+ eY′= b′X′+ e′Y′M0Y = (b′X′+ e′)(M0Xb+ e)= b′X′M0Xb+ b′X′e+ e′M0Xb+ e′e(X′e =0,(M0e)′X = e′X =0)= b′X′M0Xb+ e′eY′M0Y= b′X′M0Xb+e′e两边除以Y′M0Y,1=b′XM0XbY′M0Y+e′eY′M0YR2=b′X′M0XbY′M0Y,所以有R2=1-e′eY′M0Y。在无截距项的多元回归模型中,M0e≠e,e′M0X≠0。如果仍用(2)式计算R2,就会发生错误,并且可能得到负值。第二,对于建立有截距项的一般计量经济模型,进行截距项的检验后,再决定对截距项的取舍。这里有如下几种情况:情况一,如果在检验中,除截距项以外还有其变量不显著,此时应保留截距项,重新估计,然重新进行验证。情况二,如果在检验中只有截距项不显著,此时,作为一般的处理办法,通常是选择无截距项的模型,但必须注意的是也有例外。情况三,如果在检验中只有截距项不显著,是否一定选择无截距项的模型呢?回答是不一定,还要考虑其他方面的因素。比如所建立的计量经济模型Y = B1+ B2X+ U中只有B1不显著,但获得
的解释变量X没有接近零的数据,这时尽管B1不显著,也应选择有截距项的模型为宜。其原因是,当解释变量X距离零很远,b1X等于零的真实截距B1的估计值,由于X=0离样本均值-X较远,所以b1估计B1就不太准确,用一个不太准确的降雨量怎么测量的b1去进行统计推断,当然统计推断的可靠性就可能不准确,因此要选择有截距项的计量经济模型。第三,如果在模型中确实存在截距项,但获得的样本对模型进行估计和检验,其结果为截距项不显著,此时如果选择无截距项模型,就犯了弃真的错误。模型选取的原则是宁愿犯取伪错误,也不犯弃真错误,因为弃真的错误将导致模型的错误设定,其后果非常严重。
二、什么时候将变量T引入模型什么时候需要将时间变量T作为解释变量引入依时间序列数据建立的计量经济模型中,这是个无定论的问题。但我们认为至少在如下几种情况下,有必要把时间变量T作为解释变量引入模型中。
1•如果研究的目的之一,就是要关注应变量怎样在时间维上变动,那么在这种情况下,模型中除含有其他解释变量外,还应将时间变量T引入模型中,这样才能精确地给出时间变量T的变化对应变量的平均影响程度。
2•当影响应变量的一些基本变量是不可直接观测的,或者虽然可观测,但得不到或得不全数据时,而这些基本变量又与时间变量T存在某种线性关系,这时可用时间变量T去替代,即把时间
变量T作为解释变量引入模型中。
3•如果应变量Yt和解释变量Xt都是时间变量T的线性函数,即应变量与解释变量有共同线性趋势性,为了得到解释变量Xt对应变量Yt的平均净影响,需在模型中引入时间变量T。但要注意此时YtXt均为趋势平稳序列,如果YtXt是带常数项的单位根过程,即使在模型中引入了解释变量T,也有可能导致缪回归。
三、假设检验中的t检验与F检验的关系对于建立起的计量经济模型,需进行统计显著性检验,这已经是程序化的工作。但为什么对回归系数进行显著性检验后,还需检验模型总体线性显著性?许多教科书并未做深入分析。通常的说法是由F检验对总体回归方程进行显著性检验,但总体回归方程的线性显著性还不能说明每个解释变量医疗机构诊疗科目名录Xj对应变量Y的影响都是重要的,这就需要检验每个解释变量对应变量Y的线性作用是否显著,即进行t检验。这表明F检验不能替代t检验,F检验通过后,还需进行t检验,即存在B2=0,B3≠0,…,Bk≠0,B2,B3,…,Bk联合起来不等于零。为什么单个回归系数的t检验不显著,而联合检验显著,并且这种现象又相当普遍呢?原因是解释变量间的相互作用可能掩盖它们对回归拟合单独作用,而它们的联合影响可能仍然是显著的。但上述的表述并未告诉我们,当单个回归系数的t检验显著时,是否联合检验一定也是显著的。如果这个命题成立,说明各回归系数t检验通过后,就无需再进行F检验。
就大多数情况而言,从直观推理的角度看,若各回归系数均显著,那么它们联合起来也一定显著。但无论从理论分析上,还是从计量经济模型的应用实践上 ||| ,这个命题并不成立。首先从实践上,美国著名计量经济学家马达拉曾构造了单个回归系数均显著,而联合检验不显著的计量经济模型实例。其次从理论上分析,单个回归系数的显著性检验隐含着一个假定,即每一个显著性检验都是根据一个不同的(即独立)样本进行的。比如二元回归中,在假设B2=0下检验b2的显著性时,用于这一检验的样本不同于用来在假设B3=0下检验b3的显著性的那个样本。但如果我们用{ Yi,Xi2,Xi3}(i =1,2,…,n)同一样本去检验H0:B2= B3=0,就违反了检验方法所依据的基本假定。换言之,用同样的样本数据构造了B2B395%的置信区间,就不能断言B2B3同时落在其各自的置信区间上的概率是(0•95)(0•95)。即P[b2- tα/2se(b2)≤B2≤b2+ tα/2se(b2)] =0•95P[b3- tα/2se(b3)≤B3≤b3+ tα/2se(b3)] =0•95单独地看是正确的,但说B2B3同时落入区间[b2±tα/2se(b2),b3±tα/2se(b3)]的概率为(0•95)2就不对了。因为用同样的数据导出的这些区间不是独立的。故单个回归系数均显著,不等于联合起来也显著。综上可知,F检验通过了,还要逐个进行t检验;各自的回归系数t检验通过了,还要进行F检验,两者不能互相替代。四、为什么正相关的解释变量回归系数可能出现负值假定应变量为Y,解释变量为X1,X2,…Xj,…,Xk,并假定应变量与解释变量之间是线性关系,同时理
论预期应变量Y与解释变量Xj是正相关的,那么为什么在建立的回归方程中Xj前的回归系数可能为负值?这种违反常规的现象,可能发生在如下两种情况中:1•解释变量间具有近似共线性为了简化问题,我们以二元回归模型为例,设模型为Y = B1X1+B2X2+B3X3+ U,式中X1=1,45计量经济模型中若干具体问题的分析2X3Y正相关,回归方程为^Y = b1X1+b2X2+3X3。假定解释变量X2X3是近似共线的,X23的回归方程为X^2=α0+α1X3,X2X3的相关数为r23。并设by2by3YX1X2YX1X3回归时,X2X3前的回归系数。由于by3是模型Y = r1X1+ r3X3+εr3OLS估计量,此有by3=^r3=∑Zid3i∑d3i,其中Zi= Yi--Y,d3= X3-X。现用∑d22i∑d23i去除回归方程中b3的计算公式,并注意到X2X3的样本相关系数平方(r223),可得到:by3•2= b3=by3- by2α11- r223(3)如果解释变量X2X3不相关,r23=0,α1也为零,此时有b3= by3。当X3Y正相关, YX1X3回归时,by3肯定为正,因此b3也为正(与预期一致)。如果解释变量X2X3正相关,(3)式分母1-r223>0,而分子by3-by2α1中由于by3>0,by2>0,α>0,因此by3-by2α1可正可负可为零。这就从数理分析角度解释了为什么正相关的解释变量的回归系数可能出现负值。如果另外换个角度,从系统论的角度也不难理解正相关的解释变量回归系数可能为负值的道理。因为当单个解释变量游离在解释变量集之外与纳入解释变量之内时,对于应变量的作用
会发生量和质的变化。正如一张大网中的每个网眼都具有捕雀的功能,但独立的单个网眼却失去了这种功能。一张大网是由若干网眼组成的一个系统,每个网眼在大网中都受到其他网眼的作用,因此在大网中的网眼功能发生了质的变化,而没有纳入大网中的网眼却没有这种功能。因此,一个单个为正相关的解释变量,其回归系数在一个相互作用的系统中可能取负值。2•表征变量与真实变量符号的不一致性譬如研究收入与年龄、能力之间的关系,建立计量经济模型Y= B1+B2X2+B3X3+u,其中Y表示收入,X2表示年龄,为可观察的真实变量,X3表示能力,是不可观测的变量。由于X3不可观测,只能用可观测的表征变量Z来代替,例如可以用考试成绩作为能力的表征变量。设表征变量Z= X3+ε,εX3X2u都不相关。从预期的角度看,能力X3与收入Y是正相关的,因此回归方程的系数b3的值应为正值,但用表征变量Z代替X3,就有可能使回归方程^Y= b1+b2X2+b3Z中的b3为负值,即通过表征变量Z,没有得到真实变量X3(能力)的正确符号。至此,只是说明了真实变量与应变量是正相关的,但由于使用了表征变量,导致回归系数为负值。问题是如何保证表征变量与真实变量的系数符号的一致性呢?国外有的学者做了专门研究,并给出符合一致的判定条件为r2> R2Z*X2+1-R2Z*YX2,其中r为真实变量X3与表征变量Z之间的相关系数,R2Z*X2Zip城域网对X2回归的拟合优度,R2Z*YX2ZYX2回归的拟合优度。五、修正拟合优度-R2R2之间的关系众所周知,修正的拟
合优度-R2R2有如下关系-R2=1-n -1n - k(1- R2) (4)分析(4)式可以看出:k =1,R2=-R2;k <1,R2>-R2;R2=0,则有-R2=1- kn - k≤0(n-k >0,1-k≤0);R2=1,则有-R2=1;R2(0,1),由于1-R2<1,n -1n - k>1,所以有可能n -1n - k(1-R2)>1,故有-R2<0。例如,若回归模型中,k =3,n =30,R2=0•06-R2=-0•0096。在实际应用中,遇到-R2出现负值的情形,就把负值取为零。长江三角洲经济-R2有很多性质,使用-R2R2更适合于衡量拟合优度。当回归模型中加入新变量时,R2总会增加,-R2的值却可能增加,也可能减少。当加入新变量的t统计量大于1,-R2会增加;否则,-R2会减少。这里需要特别指出,-R2值较大是检验模型是否满意的一个必要条件,而不是充要条件。如果以-R2值最大化为检验模型的准则,恐怕是很危险的。譬如我们在回归分析中得到一个很高的-R2,但可能出现某些回归系数或者统计上不显著,或者符号与经验预期相反,此时,很高的-R2肯定不是检验模型的好准则。
参考文献:
[1]计量经济学论文[]古扎拉蒂著,林少宫译计量经济学[M]•北京:中国人民大学出版社,2000•
[2] []威廉H•格林著,王明舰等译经济计量分析[M]•北京:中国社会科学出版社,1998•
[3] 赵松山对拟合优度R2的影响因素分析与评价[J]•东北财经大学学报,2003,(3)•
[4] 赵松山,白雪梅经济计量模型的选择[J]•哈尔滨商业大学学报,2003,(1)•

本文发布于:2024-09-21 18:49:04,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/433724.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:变量   解释   截距
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议