还剩2页未读,继续阅读
文本内容:
第五幸案例分析
一、问题的提*和模型铁定为了分析不同省份或城市的交通和通讯支出的规划提供依据,分析交通和通讯支出与可支配收入的关系,建立交通和通讯支出与可支配收入的回归模型假定交通和通讯支出与可支配收入满足线性约束,则理论模型设定为cum=a+13-income+%i i其中叫表示交通和通讯支出,比加令表示可支配收入由年《中国统计年鉴》得1999CM到如下数据讯支出(单位元)i表中国年各地区城镇居民平均每人全年家庭可支配收入及交通和通
4.119981变量1可支配收入1交通和通讯支出变量可支配收入交通和通讯支出]1地E in cum地区incum甘肃
4009.
611159.
605000.
79212.30新山西
4098.
73137.
115084.
64270.09河宁夏
4112.
41231.51四
5127.
08212.46吉林
4206.
64172.65山
5380.
08255.53河南
4219.
42193.
655412.
24252.37r陕西
4220.
24191.76湖
5434.
26255.79青海
4240.
13197.04重
5466.
57337.83江西
4251.
42176.39江
6017.
85255.65黑龙江
4268.
50185.78云
6042.
78266.48内蒙古
4353.
02206.91福
6485.6334675页
4565.
39227.21:津
7110.
54258.56辽安
4617.
24201.87北江
7836.76京湖宁徽
4770.
47237.
168471.
98388.79海北
4826.
36214.
37877310369.54海南___
4852.
871384.
49265.98广883968DO_______数据来源中国统计年鉴.北京:中国统计出版社,1999・・--------------__注见数据文件cumexp_income.csv二,参裁体针利用最小二乘法估计模型的参数:1my data.Im-lmcumexp〜income summarymydata.lm软件输出的结果为RCall:lmfdrmula=cumexp〜incomeResiduals:Min IQMedian3Q Max-
97.465-
19.986-
5.
11115.
532184.115Coefficients:Estimate Std.Error tvalue Pr|t|Intercept-
56.
9179836.20624-
1.
5720.127income
0.
058080.
006488.
9621.02e-09***Signif.codes:0***
0.001**
0.
010.
050.1,1Residual standarderror:
50.48on28degrees offreedomMultiple R-squared:
0.7415,Adjusted R-squared:
0.7323估计结果为F-statistic:
80.32on1and28DF,p-value:
1.021e-09cum--
56.92+Q.06income
36.
210.01R2=
0.74s.e.=5048F=
80.32括号内为标准差三,检舱模型的异方是一图示法parmfrow=c1,2plotcumexp〜income,col=HredMablinemydata.lmplotresidualsmydata.lmA2〜income,col=nbluen一.散点图及回归线残差平方的散点图a b.从上图可以看出,残差平方对解释变量的散点图主要分布在图形中的下三角部分,大X寸dxaEno0090SSCOsaizvE-.q-sAUOS-enplcoINOOSLi0致看出残差平方随可支配收入的变动呈增大的趋势,因此,模型很可能存在异方差但是否确实存在异方差还应通过更进一步的检验二异方差检验white根据检验的步骤,计算出检验的统计量及置信水平为的临界值,判读模型white white1%是否存在异方差u2-residualsmydata.lmA2summarylmu2〜income+incomeA2#辅助回归统计量,数据来自于辅助回归中的笈值nrowmydata*
0.341#white#计算对应的临界值qchisq
0.01,df=2,lower.tail=F输出结果为Call:lmfdrmula=u2〜income+incomeA2Residuals:Min IQMedian3Q Max-
8511.0-
2362.2-
79.
0741.
522735.1Coefficients:Estimate Std.Error tvalue Pr|t|Intercept-
1.143e+
043.752e+03-
3.
0470.004999**income
2.556e+
006.716e-
013.
8060.000705***Signif.codes:0***
0.001**
0.01*
0.
050.1,1Residual standarderror:5232on28degrees offreedomMultiple R-squared:
0.341,Adjusted R-squared:
0.3174F-statistic:
14.49on1and28DF,p-value:
0.0007047统计量nrowmydata*
0.341#white
[1]
10.23qchisq
0.01,df=2,lower.tail=F
[1]
9.21034有输出结果可以看出,统计量大于临界值,我们拒接模型存在异方差,接受备择假white设三检验Goldfbld-Quanadtlibrarylmtcstgqtestmydata.lm输出结果为Goldfeld-Quandt testdata:my data.ImGQ=
9.2707,dfl=13,df2=13,p-value=
0.0001458根据值,在的置信水平下显著,拒接原假设,模型中的残差项存在异方差,而且方p1%差是逐渐增大的。
个人认证
优秀文档
获得点赞 0