目录
目录 1
1. 建立工作文件: CREATE A 78 94 3
2. 输入统计资料: DATA Y L K 3
3. 生成时间变量: GENR T=@TREND(77) 3
4. 建立回归模型: LS Y C T L K 3
(二) 建立剔除时间变量的二元线性回归模型; 4
海砂混凝土(三) 建立非线性回归模型——C-D
生产函数。 5
二、 比较、选择最佳模型 8
(一) 回归系数的符号及数值是否合理; 8
(二) 模型的更改是否提高了拟合优度; 8
(三) 模型中各个解释变量是否显著; 8
(四) 残差分布情况 8
实验三 多元回归模型
【实验目的】算法与程序设计
掌握建立多元回归模型和比较、筛选模型的方法。
【实验内容】
建立我国国有独立核算工业企业生产函数。根据生产函数理论,生产函数的基本形式为:。其中,L、K分别为生产过程中投入的劳动与资金,时间变量反映技术进步的影响。表3-1列出了我国1978-1994年期间国有独立核算工业企业的有关统计资料;其中产出Y为工业总产值(可比价),L、K分别为年末职工人数和固定资产净值(可比价)。
表3-1 我国国有独立核算工业企业统计资料
年份 | 时间 | 工业总产值 Y(亿元) | 职工人数 L(万人) | 固定资产 K(亿元) |
1978 | 1 | 3289.18 | 3139 | 2225.70 |
1979 | 2 | 3581.26 | 3208 | 2376.34 |
1980 | 3 | 3782.17 | 3334 | 2522.81 |
1981 | 4 | 3877.86 | 3488 | 2700.90 |
1982 | 5 | 4151.25 | 3582 | 2902.19 |
1983 | 6 | 4541.05 | 3632 | 3141.76 |
1984 | 7 | 4946.11 | 3669 | 3350.95 |
1985 | 8 | 5586.14 | 3815 | 3835.79 |
1986 | 9 | 5931.36 | 3955 | 4302.25 |
1987 | 10 | 6601.60 | 4086 | 4786.05 |
1988 | 11 | 7434.06 | 4229 | 5251.90 |
1989 | 12 | 7721.01 | 4273 | 5808.71 |
1990 | 13 | 7949.55 | 4364 | 6365.79 |
1991 | 14 | 8634.80 | 4472 | 7071.35 |
1992 | 15 | 9705.52 | 4521 | 7757.25 |
1993 | 16 | 10261.65 | 4498cmts | 8628.77 |
1994 | 17 | 10928.66 | 4545 | 9374.34 |
| | | | |
资料来源:根据《中国统计年鉴-1995》和《中国工业经济年鉴-1995》计算整理
【实验步骤】
一、 建立多元线性回归模型
(一) 建立包括时间变量的三元线性回归模型;
在命令窗口依次键入以下命令即可:
1. 建立工作文件: CREATE A 78 94
2. 输入统计资料: DATA Y L K
3. 生成时间变量: GENR T=@TREND(77)
4. 建立回归模型: LS Y C T L K
图3-1 我国国有独立核算工业企业生产函数的估计结果
因此,我国国有独立工业企业的生产函数为:
(模型1)
=(-0.252) (0.672) (0.781) (7.433)
模型的计算结果表明,我国国有独立核算工业企业的劳动力边际产出为0.6667,资金的边际产出为0.7764,技术进步的影响使工业总产值平均每年递增77.68亿元。回归系数的符号和数值是较为合理的。,说明模型有很高的拟合优度,F检验也是高度显著的,说明职工人数L、资金K和时间变量对工业总产值的总影响是显著的。从图3-1看出,解释变量资金K的统计量值为7.433,表明资金对企业产出的影响是显著的。但是,模型中其他变量(包括常数项)的统计量值都较小,未通过检验。因此,需要对以上三元线性回归模型做适当的调整,按照统计检验程序,一般应先剔除统计量最小的变量(即时间变量)而重新建立模型。
(二) 建立剔除时间变量的二元线性回归模型;
命令:LS Y C L K
则生产函数的估计结果及有关信息如图3-2所示。
图3-2 剔除时间变量后的估计结果
因此,我国国有独立工业企业的生产函数为:
(模型2)
=(-2.922) (4.427) (14.533)
从图3-2的结果看出,回归系数的符号和数值也是合理的。劳动力边际产出为1.2085,资金的边际产出为0.8345,表明这段时期劳动力投入的增加对我国国有独立核算工业企业的产出的影响最为明显。模型2的拟合优度(99.56%)较模型1(99.58%)并无多大变化,F检验也是高度显著的(F0.05(2,14)=3.74<1589.953)。这里,解释变量、常数项的(t0.025(14)=2.145)检验值都比较大,显著性概率都小于0.05,因此模型2较模型喀什师范学院学报1更为合理。
(三) 建立非线性回归模型——C-D生产函数。
C-D生产函数为:,对于此类非线性函数,可以采用以下两种方式建立模型。
方式1:转化成线性模型进行估计;
在模型两端同时取对数,得:
在EViews软件的命令窗口中依次键入以下命令:
GENR LNY=log(Y)
GENR LNL=log(L)
GENR LNK=log(K)
LS LNY C LNL LNK
则估计结果如图3-3所示。练月琴
图3-3 线性变换后的C-D生产函数估计结果
即可得到C-D生产函数的估计式为:
(模型3)
= (-1.172) (2.217) (9.310)
即:
从模型3中看出,资本与劳动的产出弹性都是在0到1之间,模型的经济意义合理,而且(99.58%)拟合优度较模型2(99.56%)还略有提高,解释变量都通过了显著性检验。
方式2:迭代估计非线性模型,迭代过程中可以作如下控制:
⑴在工作文件窗口中双击序列C,输入参数的初始值;
⑵在方程描述框中点击Options,输入精度控制值。
控制过程:
①参数初值:0,0,0;迭代精度:10-3;
则生产函数的估计结果如图3-4所示。
图3-4 生产函数估计结果
此时,函数表达式为:
(模型4)
=(0.313)(-2.023)(8.647)
可以看出,模型4中劳动力弹性=-1.01161,资金的产出弹性=1.0317,很显然模型的经济意义不合理,因此,该模型不能用来描述经济变量间的关系。而且模型的拟合优度也有所下降,解释变量L的显著性检验也未通过,所以应舍弃该模型。
②参数初值:谋杀章鱼保罗0,0,0;迭代精度:10-5;
图3-5 生产函数估计结果
从图3-5看出,将收敛的误差精度改为10-5后,迭代100次后仍报告不收敛,说明在使用迭代估计法时参数的初始值与误差精度或迭代次数设置不当,会直接影响模型的估计结果。
③参数初值:0,0,0;迭代精度:10-5,迭代次数1000;
图3-6 生产函数估计结果
此时,迭代953次后收敛,函数表达式为:
(模型5)
=(0.581)(2.267)(10.486)
从模型5中看出,资本与劳动的产出弹性都是在0到1之间,模型的经济意义合理,,具有很高的拟合优度,解释变量都通过了显著性检验。将模型5与通过方式1所估计的模型3比较,可见两者是相当接近的。
④参数初值:1,1,1;迭代精度:10-5,迭代次数100;
图3-7 生产函数估计结果
此时,迭代14次后收敛,估计结果与模型5相同。
比较方式2的不同控制过程可见,迭代估计过程的收敛性及收敛速度与参数初始值的选取密切相关。若选取的初始值与参数真值比较接近,则收敛速度快;反之,则收敛速度慢甚至发散。因此,估计模型时最好依据参数的经济意义和有关先验信息,设定好参数的初始值。
二、 比较、选择最佳模型
估计过程中,对每个模型检验以下内容,以便选择出一个最佳模型:
(一) 回归系数的符号及数值是否合理;
(二) 模型的更改是否提高了拟合优度;
(三) 模型中各个解释变量是否显著;
(四) 残差分布情况
以上比较模型的㈠、㈡、㈢步在步骤一中已有阐述,现分析步骤一中5个不同模型的残差分布情况。
分别在模型1~模型5的各方程窗口中点击View/Actual, Fitted, Residual/ Actual, Fitted, Residual Table(图3-8),可以得到各个模型相应的残差分布表(图3-9至图3-13)。
可以看出,模型4的残差在前段时期内连续取负值且不断增大,在接下来的一段时期又连续取正值,说明模型设定形式不当,估计过程出现了较大的偏差。而且,模型4的表达式也说明了模型的经济意义不合理,不能用于描述我国国有工业企业的生产情况,应舍弃此模型。
模型1的各期残差中大多数都落在的虚线框内,且残差分别不存在明显的规律性。但是,由步骤一中的分析可知,模型1中除了解释变量K之外,其余变量均为通过变量显著性检验,因此,该模型也应舍弃。
模型2、模型3、模型5都具有合理的经济意义,都通过了检验和F检验,拟合优度非常接近,理论上讲都可以描述资本、劳动的投入与产出的关系。但从图3-13看出,模型5的近期误差较大,因此也可以舍弃该模型。