还剩5页未读,继续阅读
文本内容:
第九章回归分析第01讲回归直线方程的建立
(一)变量之间的函数关系与相关关系函数关系具有确定性,例如电路中的电压V、电流I、电阻R三者间有关系I=V/R.相关关系具有非确定性,例如人的血压与年龄有关,炼钢过程中含碳量与精炼时间有关,农作物产量与施肥量和单位面积的播种量有关.共同特点不能用确定性的函数关系表达.存在相关关系的变量一般是随机变量或至少其中一个是随机变量.本章内容第一节回归直线方程的建立第二节回归方程的显著性检验第三节*预测与控制注第三节为非自考内容第一节回归直线方程的建立一元线性回归模型设随机变量Y依赖于自变量X,作n次独立重复试验,得到关于Y与X的n对观测值(,yD,i=1,2,…,n,Xi根据这n对观测值的信息可在平面直角坐标系中绘制出相应的散点图.各对观测值可用点(的,)1),(七,『・・♦(4,/)表示.如果各个观测值所对应的点散布在某条直线的周围,则可以把随机变量Y与变量X的关系描述为一元线性回归模型可见,随机变量Y的值可视为两部分的叠加,一部分为Y随x的变化而线性变化的部分(B0+B凶),另一部分是试验过程中其他一切随机因素的总和,在模型中用一表示,被称作随机误差项.在以上模型中,6,~且相互独立,则有J八‘(自十4天,广).〜回归分析的基本问题是依据样本数据解决如下问题⑴未知参数B,及2的点估计.若瓦.以分别为B,工的估计,由此可得E(Y)的估计上式是描述Y与X之间关系的经验公式,我们称上式为Y关于x的一元线性回归方程,它就是我们要求的Y与x之间的定量关系的表达式,其图像类似于直线,称此直线为回归直线,方也称为回归系数,它是回归直线的斜率,/%称为回归常数,它是回归直线的截距.
(2)回归方程的显著性检验.在实际问题中,Y与x之间是否存在关系式Y=,需要经过检验进行判定.B°+BIX+£
(3)利用回归方程进行预测和控制.参数B,Bi及2的点估计问题要求对所有的X”观测值.与回归值•虫=月+,工1的偏离达到最小.为此,一般采用最小二乘法求M的估计值.已知样本令((即)仇-«)一件式・24=£最小二乘法的基本思想是选取B,3的估计量除全使向,((Q A=nHnQ AG第02讲回归直线方程的建立
(二)根据微积分中求函数极值的知识,有展浜*孙=-20,范卜=--A-0经整理后,可化为欣(£七)=£乂,♦U1应+(£帚)6,=£5,l41—1我们将上式称为正规方程组.解正规方程组,得到A_1I I・—«aT.7A=H,如果弓I进记号[4=%”3=£/晶I1■______・__-xXyt-yyG=X$=2J.rxH11R_H4=£G「,y=£r;-“,11则最小二乘估计为a隰二7-库.回归方程的另一形式为£-y“x-x工说明回归直线通过散点图的几何重,中
3.Po与住的最小二乘估计的性质,D£A=A.EA=A14=苒卜哂==『.结合以上两条性质以及正态分布的性质.,有加GA~N【例题•填空题】+Pixi+J设一元线性回归模型为豆=4=1,2,・,”,则E£i=.『正确答案J根据一元线性回归模型的要求,知E j=
0.【例题•计算题】某市市区的社会商品零售总额y和当地居民的可支配收入总额x之间的年统计数据单位亿元为Xi,Yi,i=l,2,•••,10,经计算得101010£胃=4172£乂=9323,£6=198422=
106266.01,2天乂=
45716.
22.试求y对x的线性回归方程.『正确答案』茗*与,[=,,・一元线性回归模型为%=4+412解正规方程组后,得到1一a=-J I区£=y-x,代入已知数据,得到4571622-^4172X93234571a22-2x38895556”才~.仪%
198422..
4171983174055.84产悬y=A
932.3=
93.
23.t«^x,=a4172=
41.72x-加=9323-28x4172—
23.59因而,y对x的线性回归方程为£=一
23.59+2第03讲回归方程的显著性检验第二节回归方程的显著性检验
1.F检验法
2.t检验法
1.F检验法由一元线性回归模型必=A+…述9可知,若Y与X之间不存在线性关系,则一次项系数8产0,反之,MNO.所以检验Y与X之间是否具有线性关系,应归纳为检验假设:HoB i—O;HiB iWO为了检验Ho是否为真,我们可以从分析各y”i=l,2,…,n的不同原因着手.n个yi的值之所以不同的原因有
二一、如果E Y的确是随x线性变化的,那么x的取值不同就是一个原因;
二、其他一切随机因素的影响.显然,如果前一方面的影响是主要的,那么3N0,方程是有意义的,否则方程就没有意义.为此,必须把由这个原因所引起的y.的波动大小从yi的总波动中分解出来.记.sr=L„=J^i-yY^称其为总的偏差平方和,它反映了各Yi的波动大小.其中,=之9-寸=庠/-a=鬲4=衣4£M ul反映了由于X的变化所引起的波动大小,称为回归平方和.,而5-=自小一无尸反映了观测值与回归直线间的偏高,这是由其他一切因索所引起的,称为剩余平方和.n_S回称为平方和分解式.rI在假定各e相互独立,且\~N O,2的条件下,可以证明Q亭“-2;2由小号“1D;相互独立.于是,当为百时,尸=$片—每FL A-2L一拒绝域为眇=[尸.L〃-2X4w.其中,Fal,n-2为显著性水平为a的条件下的临界值.若由样本观测值计算出F的值落在W内,则作出拒绝H的判断,这时我们认为,回归方程是显著的;反之,称回归方程不显著.这种用统计量F来检验回归方程显著与否的方法称为F检验法.方差分析表表9—
3.来源平方和自由度均方显著性回归■时,拒绝剩余n-2否则接受总和R-1教材P233表9—
3.
2.t检验法欲检验假设H^=0;e由S“相互独立以及t分布的定义,可知即r=f三向一””一订6/A当假设%4=0为百时,由上式有T=~“一23w拒绝域为彳-―js-2»ua.s-2,4«其中.F=若由样本观测值计算出t的值落在W内,则作出拒绝H的判断一一元线性回归是显著的;反之,称回归效果不显著.这种用统计量t来检验回归效果显著与否的方法称为t检验法.线性回归不显著的主要原因:1除x外,还存在其他不可忽略的影响Y的因素.
(2)Y与x的关系不是线性的,而是存在着其他的关系,例如,存在着曲线关系.
(3)Y与x无关.【例题•单选题】在线性回归模型=自+0七鸟J=L2,•一,叫中,总的偏差平方和为SST,剩余平方和为SSE,回归平方和为SSR,三♦者之间的关系是().A.SSE=SST+SSRB.SSR=SST+SSEC.SST=SSE+SSRD.SST+SSE+SSRR『正确答案』■_根据平方和分解式力可知,总平方和二剩余平方和+回归平方和,即SST=SSE+SSR,对照选项,应选C.本章小结本章在第
六、第
七、第八章的基础上,对具有相关关系的变量之间作特定的分析一一这里是指回归分析,以便建立反映两者关系的回归方程.内容虽然较简单,但体现了对估计理论和假设检验的较好运用,也介绍了较新的估计参数的手法一一最小二乘(估计)法.本章要求如下
一、会通过两个变量间数据对的散点图,粗略判断其线性回归的显著性,理解一元性线回归模型,运用已给数R.R.A N据列出正规方程并解出,以,从而建立回归方程
二、会求回归方程中未知参数的估计值.。
个人认证
优秀文档
获得点赞 0