例如,在改革中,某企业重视科技人才,提供了足够的科研经费,获得了良好的经济效益。下表是该企业1987~1998年的经济效益、科研人员、科研经费的统计数据。假定1999年该企业科研人员61名、科研经费40万元,试预测1999年该企业的经济效益。 年份 | 经济效益 (万元) | 科研人员 (名) | 科研经费 (万元) | 年份 | 经济效益 (万元) | 科研人员 (名) | 科研经费 (万元) |
1997 | 406 | 19 | 8.5 | 2003 | 632 | 38 | 13.7 金冷法 |
1998 | 484 | 24 | 9.7 | 2004 | 685 | 47 | 14.4 |
1999 | 504 港口法 | 26 | 10.4 | 2005 | 750 | 49 | 16.2 |
2000 | 520 | 28 | 11.3 | 2006 | 794 | 50 | 18.5 |
2001 | 560 | 31 | 12.2 | 2007 | 和为美866 | 51 | 20.3 |
2002 | 591 | 33 | 12.8 | 2008 | 989 | 53 | 25.0 |
| | | | | | | |
回归分析是研究某一随机变量(因变量或被解释变量)与其他一个或几个普通变量(自变量或解释变量)之间的数量变动关系的,由回归分析求出的关系式是回归模型。而要研究及测度两个及两个以上变量之间关系,除上述的回归分析法外,常用的方法还有相关分析。相关分析是研究两个或两个以上随机变量之间的相互依存关系的紧密程度的。直线相关时用相关系数表示,曲线相关时用相关指数表示,多元相关时用复相关系数表示,通常相关系数或相关指数或复相关系数的取值范围为0~1,该值越接近1说明两随机变量之间的相关程度越强,若该值等于0,则两随机变量相互独立。 这两种分析方法的区别是,相关分析研究的都是随机变量,并且不分自变量与因变量;回归分析研究的变量要定出自变量与因变量,并且自变量是确定的普通变量,因变量是随机变量。但在实际工作中,这两种分析是研究现象之间相互依存关系的不可分割的两个方面。一般先进行相关分析,根据相关系数或相关指数的大小对变量进行筛选,剔除不相关或是相关性小的变量,然后再进行回归分析,建立回归模型,进行预测。
本例有两个自变量:科研人员与科研经费。下面先分析它们与因变量经济效益的相关性。
具体操作步骤如下:
选择工具菜单中的数据分析命令,弹出数据分析对话框。
在分析工具列表框中,选相关系数工具。
这时将出现相关系数对话框,如图8-7所示。
图8-7
在输入框中指定输入参数。在输入区域指定数据所在的单元格区域B1:D13;因输入数据是 以列方式排列的,所以在分组方式中选择逐列;因指定的输入区域包含标志行,所以选中标志位于第一行复选框。
在输出选项框中指定输出选项。本例选择输出区域,并指定输出到当前工作表以F3为左上角的单元格区域。
单击确定按钮。
所得到的相关分析结果如图8-8所示。
图8-8
从图8-8中F3:I6区域所给出的相关系数可以看出,科研人员与科研经费和经济效益都有较强的相关性。因此,需要利用悬臂梁挠度计算公式回归分析工具进一步建立关系式。
②建立回归模型
通常,在相关分析的基础上必须拟合回归模型,以便进行推算、预测。建立回归模型的具体操作步骤如下:
选择工具菜单中的数据分析命令,弹出数据分析对话框。
在分析工具列表框中,选回归工具。
这时,将弹出回归对话框,如图8-9所示。
冰点特稿图8-9
指定输入参数。在输入Y区域、输入X区域指定相应数据所在的单元格区域,本例分别指定为B1:B13和C1:D13,并选定标志复选框,在置信水平框内键入95%。对于一些特殊的回归模型,可以根据需要指定常数为0(即 )。
指定输出选项。这里选择输出到新工作表组,并指定工作表名称为“回归模型”,选定残差(即随机误差项)和正态分布中的所有输出选项,以观察相应的结果。
单击确定按钮。
最后得到回归分析的计算结果。图8-10是有关回归分析的统计量、方差分析表和回归系数及其 检验、预测区间等数据;图8-11给出了预测值、残差值以及所计算的DW统计值;图8-12给出了自变量 (科研人员)与 (科研经费)的残差分析图;图8-13给出了自变量 与 的最佳适配回归线图;图8-14给出了样本百分比排位及正态概率图。
分析图8-10、8-11中的计算结果,可得下述检验结论(本例样本个数n=12,解释变量个数k=2)。
检验:在回归统计区域A3:B8中,给出的 为0.997644,调整后的 为0.997121,均很接近1,说明 节日圆舞曲与 的关系很密切。
检验:在方差分析区域A10:F14中,给出的 检验值为1905.786远远大于 =4.26,说明 与 之间的回归效果非常显著。
图8-10
图8-11
检验:在回归模型区域A16:I19中,给出了回归系数 的估计值及其标准误差、 检验值和回归系数估计区间的上下限等。由于各回归系数的 检验值分别为 =12.7637, =7.5472, =18.7804,都大于 =2.2622,故拒绝原假设 =0, =0和 =0。即可以断言:科研人员与科研经费对该企业的经济效益有显著影响。