还剩7页未读,继续阅读
文本内容:
相关分析与回归分析
一、试验目标与要求本试验项目的目的是学习并使用SPSS软件发展相关分析和回归分析,具体包括1皮尔逊pearson简单相关系数的计算与分析⑵学会在SPSS上实现一元与多元回归模型的计算与检验3学会回归模型的散点图与样本方程图形4学会对所计算结果发展统计分析说明5要求试验前,了解回归分析的如下内容参数a、0的估计♦回归模型的检验方法回归系数B的显著性检验〔七一检验〕;回归方程显著♦性检验〔F—检验〕
二、试验原理
1.相关分析的统计学原理相关分析使用某个指标来明确现象之间相互依存关系的密切程度用来测度简单线性相关关系的系数是Pearson简单相关系数
2.回归分析的统计学原理相关关系不等于因果关系,要明确因果关系必须借助于回归分析回归分析是研究两个变量或者多个变量之间因果关系的统计方法其根本思想是,在相关分析的根抵上,对具有相关关系的两个或者多个变量之间数量变化的普通关系发展测定,确立一个适宜的数据模型,以便从一个量判断另一个未知量回归分析的主要任务就是根据样本数据估计参数,建立回归模型,对参数和模型发展检验和判断,并发展预测等线性回归数学模型如下y=P+P x+0x+...+0x+£/01/12/2k ik/在模型中,回归系数是未知的,可以在已有样本的根抵上,使用最小二乘法对回归系数发展估计,得到如下的样本回归函数+卜y=[T+[T xx+…+x+ei01/12/2k iki回归模型中的参数估计出来之后,还必须对其发展检验如果通过检验发现模型有缺陷,如此必须回到模型的设定阶段或者参数估计阶段,重新选择被解释变19881996198919972993199019981991199919922000199320013983199420021348量和解释变量与其函数形式,或者对数据发展加工整理之后再次估计参数回归模型的检验包括一级检验和二级检验一级检验又叫统计学检验,它是利用统计学的抽样理论来检验样本回归方程的可靠性,具体又可以分为拟和优度评价和显著性检验;二级检验又称为经济计量学检验,它是对线性回归模型的假定条件能否得到满足发展检验,具体包括序列相关检验、异方差检验等
三、试验演示内容与步骤
1.连续变量简单相关系数的计算与分析在上市公司财务分析中,往往利用资产收益率、净资产收益率每股净收益和托宾Q值4个指标来衡量公司经营绩效本试验利用SPSS对这4个指标的相关性发展检验操作步骤与过程打开数据文件“上市公司财务数据(连续变量相关分析).sav〃,挨次选择“【分♦析】T【相关】T【双变量】〃打开对话框如图,将待分析的4个指标移入右边的变量列表框内其他均可选择默认项,单击ok提交系统运行图
5.1Bi variate Cor re I at ions对话框结果分析表给出了Pearson简单相关系数,相关检验t统计量对应的p值相关系数右上角有两个星号表示相关系数在
0.01的显著性水平下显著从表中可以看出,每股收益、净资产收益率和总资产收益率3个指标之间的相关系数都在
0.8以上,对应的P值都接近0,表示3个指标具有较强的正相关关系,而托宾Q值与其他3个变量之间的相关性较弱表
5.1Pearson简单相关分析Cor re I at i ons净资产收益每股收益率率资产收益率托宾Q值每股收益率Pearson
1.877**.824**Correlation.199,
000.000Sig.2-tai led315315315315N.877**
1.808**净资产收益率PearsonCorreI ati on.
983.
000.000Sig.2-ta iIed315315315315N.
011.824**.808**1资产收包率Pearson.849CorreI ati on.
000.000315Sig.2-ta iIed315315315N
1.011托宾Q值PearsonCorreI ati on.199,
983.849315315315Sig.2-ta iIed315N**Cor reI ati oni ssignificant atthe
0.01I eveI2-tai led.
2.一元线性回归分析实例分析家庭住房支出与年收入的回归模型在这个例子里,考虑家庭年收入对住房支出的影响,建立的模型如下y=a+0xi+£i i其中,yi是住房支出,xi是年收入线性回归分析的根本步骤与结果分析〔1〕绮撒点图打开数据文件,选择【图形】-【旧对话框】-【散点/点状】,如图
5.2所示图
5.2散点图对话框选择简单分布,单击定义,打开子对话框,选择X变量和Y变量,如图53所示单击ok提交系统运行,结果见图
5.4所示图
5.3Simple Scatterplot子对话框从图上可直观地看出住房支出与年收入之间存在线性相关关系700-200~
1.00-600800woo12’00140016*0018002ooo年收入《1美元图
5.4散点图〔2〕简单相关分析选择【分析】一>【相关】一>【双变量】,打开对话框,将变量“住房支出〃与“年收入〃移入variables列表框,点击ok运行,结果如表
5.2所示表
5.2住房支出与年收入相关系数表Cor reI ati ons住房支出〔千美元〕年收入〔千美元〕.966**
1.00020住房支出〔千美兀〕Pearson CorreIati on
20.966**1Sig.2-tai IedN.000年收入〔千美兀〕Pearson Correlation2020Sig.2-tailed N**CorreIati oni ssignificant atthe
0.01I eveI2-tai led.从表中可得到两变量之间的皮尔逊相关系数为o.966,双尾检睑概率P值尾
0.000<
0.05,故变量之间显著相关根据住房支出与年收入之间的散点图与相关分析显示,住房支出与年收入之间存在显著的正相关关系在此前提下进一步进展回归分析,建立一元线性回归方程3线性回归分析步骤1选择菜单【分析】->【回归】->【线性】〃,打开Linear Regression对话框将变量住房支出y移入Dependent列表框中,将年收入x移入I ndependents列表框中在Method框中选择Enter选项,表示所选自变量全部进入回归模型68800808图
5.5L inear Regresssion对话框步骤2单击Statistics按钮,如图在Statistics子对话框该对话框中设置要输出的统计量这里选中估计、模型拟合度复选框图
5.6Stat ist ics子对话框估计输出有关回归系数的统计量,包括回归系数、回归系数的标准差、标♦准化的回归系数、t统计量与其对应的P值等置信区间输出每一个回归系数的95%的置信度估计区间♦协方差矩阵输出解释变量的相关系数矩阵和协差阵♦模型拟合度输出可决系数、调整的可决系数、回归方程的标准误差回归方♦程F检验的方差分析步骤3单击绘制按钮,在Plots子对话框中的标准化残差图选项栏中选中正态概率图复选框,以便对残差的正态性发展分析图
5.7plots子对话框步骤4单击保存按钮,在Save子对话框中残差选项栏中选中未标准化复选框,这样可以在数据文件中生成一个变量名尾res_1的残差变量,以便对残差发展进一步分析图
5.8Save子对话框其余保持Spss默认选项在主对话框中单击ok按钮,执行线性回归命令,其结果如下表
5.3给出了回归模型的拟和优度[R Square、调整的拟和优度Adjusted RSquareJ、估计标准差〔Std.Error ofthe EstimateJ以与Durb in—Watson统计量从结果来看,回归的可决系数和调整的可决系数分别为
0.934和
0.93,即住房支出的90%以上的变动都可以被该模型所解释,拟和优度较高表54给出了回归模型的方差分析表,可以看到,F统计量为
252.722,对应的P值为0,所以,拒绝模型整体不显著的原假设,即该模型的整体是显著的表
5.5给出了回归系数、回归系数的标准差、标准化的回归系数值以与各个回归系数的显著性t检验从表中可以看到无论是常数项还是解释变量x,其t统计量对应的P值都小于显著性水平
0.05,因此,在
0.05的显著性水平下都通过了t检验变量x的回归系数为
0.237,即年收入每增加1千美元,住房支出就增加
0.237千美元表
5.3回归模型拟和优度评价与Durbin-Watson检验结果Mode I SummarybAdjusted RStd.Error oftheMode IR RSquare SquareEstimate
1.966a.934,
930.37302a Predi ctors:Constant,年收入〔千美元〕b DependentVar iab Ie:住房支出〔千美元〕表
5.4方差分析表AN0VA bModeISumof Squaresdf MeanSquare FSig.1Regress io
1.000anResidual18,139Tota I19a Predictors:Constant,年收入〔千美元〕b DependentVar iable:住房支出〔千美元〕表
5.5回归系数估计与其显著性检验Coeff ic ientsaStandard izedUnstandard izedCoefficientsMode ICoefficients tSig.BetaB Std.Error1Constant.890,
204.000年收入〔千美元〕.
237.
015.966,000a DependentVar iable:住房支出〔千美元〕为了判断随机扰动项是否服从正态分布,观察图
5.9所示的标准化残差的P—P图,可以发现,各观测的散点根本上都分布在对角线上,据此可以初步判断残差服从正态分布为了判断随机扰动项是否存在异方差,根据被解释变量y与解释变量x的散点图,如图
5.4所示,从图中可以看到,随着解释变量x的增大,被解释变量的波动幅度明显增大,说明随机扰动项可能存在比拟严重的异方差问题,应该利用加权最小二乘法等方法对模型发展修正Normal P-P Plotof RegressionStandardized ResidualDependentVariable:彳支出l.o
0.8-
0.
60.4-
0.
20.
00.
20.
40.
60.
81.0Observed CumProb图
5.9标准化残差的P-P图
四、备择试验现有1987~2003年某某省全社会固定资产投资总额NINV和GDP两个指标的年度数据,见下表试研究全社会固定资产投资总额和GDP的数量关系,并建立全社会固定资产投资总额和GDP之间的线性回归方程某某省全社会固定资产投资和GDP年度数据GDP〔亿NINV〔亿GDP〔亿NINV〔亿年份年份元〕元〕元〕元〕19871995523。
个人认证
优秀文档
获得点赞 0