还剩25页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
第四章习题
1.TestScor^=
520.4-
5.82x22=
392.36175/=222A TestScore=-
5.82x23-19-
23.28即平均测试成绩所减少的分数回归预测值为
23.28Tes/Score=8+8ixCS=
520.4-
5.82x
1.4=
395.853〃14-------£山二SER2=1152〃-2/=1・・2=SER
2.SSR=Z6i xn-2=
11.5xl00-2=
12960.5i=\ESS SSR9----------------R2==1-=
0.08TSS TSS・・
22.TSS=SSRX1-R=
12960.5X1-
0.08=
14087.5=Y.-Kzi=\]〃一・・
22.SY=——y Yz-y=l
4087.5-l00-l«
140.30n-1i/=SY=
11.
932.1
①Weigh^Heigh®=-
99.41+
3.94x70=
176.39
②Weigh^=-
99.41+
3.94x65=
156.69Height=65
③血,g,=-
99.41+
3.94x74=
192.15Height=142AWeight=
3.94x
1.5=
5.9131inch=
2.54cm,1lb=
0.4536kg@Wg/zkg=-
99.41x
0.4536+Heightcm=-
45.092+
0.7036xHeightcm
2.54
②无量纲,与计量单位无关,所以仍为R
20.81
③SER=
10.2x
0.4536=
4.6267kg
3.1
①系数为回归截距,决定回归线的总体水平
696.7
②系数为回归系数,体现年龄对周收入的影响程度,每增加岁周收入平均增
29.61力口$
9.6美元,其度量单位为美元3SER=
624.1B3-
0.29-0KB3==
7.
252.58SE p
30.
04、对的回归系数都在水平下统计显著模型nCollege FemaleAge AHE1%3:厌-
5.44-0==
25.
9052.58SE@
0.21自--
2.62-0K82==
13.
12.58区SE
0.20区-唯
0.29-03=
7.
252.58SEp
0.043川-0,69水平下临界值°=
2.
31.965%t
0.30唯
2.464=SE p4及-
0.60-0唯
2.465==
2.
1431.96SE p
50.28IMI唯-
0.27-06=
1.
0381.
960.26对的回归系数都在水平下统计显著,、College FemaleAge AHE1%Northeast Midwest对的回归系数在水平下统计显著对的回归系数在水平下统AHE5%South AHE5%计不显著
2.模型中对的回归系数均在水平下统计显著,自然在水平下同样统计显著1College AHE1%5%二基于这个回归得到的大学学历和高中学历每小时收入差距估计在水平下统计显著该5%差距即为的值,其置信区间为[其中B195%-
1.96SE,+
1.96SE],=
5.46,SE=
0.21A Pie[
5.8716,
5.8716]即学学历和高中学历每小时收入差距估计置信区间为95%[
5.8716,
5.8716]模型中对的回归系数均在水平下统计显著,自然在水平下同样统计显著1Female AHE1%5%=基于这个回归得到的男性与女性收入差距估计在水平下统计显著5%该差距即为的值,其置信区间为[其中B295%-
1.96SE,+
1.96SE],=-
2.64,SE=
0.20/.p2G[-
3.032,-
2.248]即学学历和高中学历每小时收入差距估计置信区间为5%
13.032,2248]
3.年龄是收入的主要决定因素因为其统计值远大于水平下的统计临界值2t
7.25,1%t其对应的值必然远小于统计上显著性非常强
2.46,p
0.01,3仅施澳餐=4AA%,=,3*63*Age Sally-Age8esty=-5^的置信区间为[其中8395%-
1.96SE,+
1.96SE],=
0.29,SE=
0.04/.Pae[
0.2116,
0.3684]即与期望收入差距的置信区间为卜期Sally Besty95%
0.3684,-
0.2116],Besty望收入比高Sally
4.地区之间存在重大差异1考察地区对收入的回归系数显著性,需对进行联合假设,得地区效应的=0统计值为水平下统计临界值,因此地区对的效应在F
6.
103.781%AHE1%水平下统计显著,即地区间存在重大差异AHE2
①=夕一°二夕MHEj GmMoily=**6,JHa—X6,6*Q614的置信区间为[其中B695%-
1.96SE,+
1.96SE],=-
0.27,SE=
0.26/.Pee[-
0.7796,
0.2396]即与期望收入差距的置信区间为卜Juantia Molly95%
0.7796,
0.2396]二风*二一°二夕,二
②MHEjem3,Molly5^Jennifer-^5,45*Q5Juantia.Molly A.而“==凤一片=jwimia,Juantia.Molly~~Jennifer,Molly求,即求多个系数的置信集,与联合假设检验理念相同与的置信区间均为线型区间,两者存在相关性,因此的的置信区间必然为椭圆区间
5.95%.如果在回归中加入而去掉新回归模型中的回归系数,只要求出的6West Midwest,South置信区间即刻,计算就可简化了95%假设没有显著变化,即HO,H1/X/X人人一夕A,1998-A,199201,19981,1992一
05.29—
5.48A,1998-A,1992水平下临界值X
0.
6551.965%tJSE*26,1998+SE~
499270.212+
0.202+S£A1992-2COVA1998‘A,1992在水平下不能拒绝假设,即年相较年对的回归系数在统计上暂5%19981992College AHE无证据显示有显著变化注年的样本与年不同,因此与不相关,即19921998cov,=0,单从本次的调研数据来看,确实可以得到性别收入差异的推断但并不能武断说存6在性别歧视有可能是部分女性将精力专注于家庭而降低工作积极性,使得升职、涨工资速度慢,甚至遇到提升瓶颈,从而造成女性平均工资低于男性
7.水平下临界值1tBi==OS-=
0.1858Vl.965%t|SE0P|
2.61的系数在统计上与没有显著差异=BDR0与中的答案不相符,但与更一般的回归相符中答案显示在房屋面积等因11素不变情况下房间数量对房屋价格没有显著影响但一般情况下,房间数量多房3屋面积也会大,而房屋面积与价格显著正相关,所以房屋价格就会较高4房屋价值变化5AWMSSLsize=200004的置信区间为[其中6495%-
1.96SE,+
1.96SE],=
0.002,SE=
0.00048・..04e[-
0.0010592,
0.0029408]即她房屋价值变化的置信区间为卜95%
0.0010592,
0.0029408]有更合适的度量尺度总面积的系数及其标准误都非常小,计算结果会由于保Lsize留的小数位数限制而不精确,并且其系数太小容易使人“小看”它对房屋价格的影响力,不利于比较各变量对房屋价格的影响程度大小所以,最好选用小的度量单位,或者对其进行标准化处理水平下工g统计临界值5F=
0.
082.3010%与的系数在水平下统计显著等于nBDR Age10%
08._]R几SSR/5-k-D_]—1SSR_]1n-k-\TSS n-k-\・・铲,.一.R2=]_Q_1—I n-\・2!--------------------------------------模型..Ri=l-1-R——=1-1-
0.049=
0.05121n-\420-12〈严-%模型R=1-1-.2T=]_]_
0.42442°-2T.42672n-\420-12=02模型R3=l-1-42T=1-1-
0.7733T.77463=03n-\420-1—yi—k—1430—4—12---------------------------模型R=———=1-1-
0.626=
0.6296444n-1420-1—T n-k-1470-5-125----------------------------------模型R=1-1-R/———=1-1-
0.773=
0.7757555几一1420-1约束条件63=84=0无约束回归模型Y=B0+B1X1+82X2+B3X3+B4X4,R2unrestricted=R52=
0.7757有约束回归模型Y=B0+B1X1+B2X2,R2restricted=R22=
0.4267_R restricted-R unrestricted/q
0.4267-
0.7757/2ooo noo/〃一侬…水1-^unrestricted
0.7757/420-5-1-
3.005%平下统计临界值,因此拒绝的原假设,该统计量在B3=84=05%水平下显著3q=2区-唯-
0.592-03---------------水平下统计临界值=
15.
5792.8071%t BonferroniSE@
0.0386-
0.048-0tP=
0.
8142.8074SEp
40.059在水平下拒绝原假设,不成立1%83=84=0的置信区间为[其中4B199%-
2.58SE,+
2.58SE],=-
1.01,SE=
0.27/.Pie[-
1.7066,-
0.3134]
9.1HO:B1=B2,H1:B1WB2若成立则Ho Yi=p04-plXli+p2X2i4-Ui=P04-PlXlrP2Xli4-p2Xli4-P2X2i4-Ui=pO4-p1-p2Xli+p2Xli4-X2i+Ui令Y=B1-B2,Wi=X1i+X2i,则Yi=pO+y X1i+B2Wi+ui假设变为HO:y=0,H1:yWO只需设置变量、为自变量对回归,求出回归系数丫的统计值,进行W=X1+X2,X1W YW t检验t2HO:Bl+aB2=0,Hl:Bl+aB2W0若成立则Ho Yi=pO+plXli+p2X2i+Ui=3o+PlXlrap2Xli+ap2Xli+p2X2i+Ui=pO+Pl-aP2Xli+P2aXli+X2i+Ui令丫=81B2,Wi=aX1i+X2i,则Yi=B0+丫X1i+B2Wi+ui假设变为HO:y=0H1:yWO5只需设置变量、为自变量对回归,求出回归系数的统计值,进W=aX1+X2,X1W YW Yt行检验t3HO B1+B2=1,Hl81+82W1若成立则Ho Yi=Po+PlXli+P2X2i+Ui=Po4-plXli4-p2-1Xli4-Xli-p2Xli4-P2X2i+Ui=pO+pl+p2-1Xli+p2X2rXli+Ui+Xli=Yi-Xli=pO4-pH-p2-1Xli+p2X2i-Xli+Ui令Y=B1-a B2,Zi=Yi-X1i,Wi=X2i-X1i,则Zi=B0+Y X1i+e2Wi+ui假设变为HO:y=0H1:yWO5只需设置变量、为因变量对回归,求出回归系数丫的统计Z=Y-X1,W=X2-X1,X1W ZW t值,进行检验t第八章习题
1.百万美元时,销售额增长率=Sales2002=198=
1.0204%lOOx[lnSales2oo2-lnSales ooi]=100xln198-ln196=
1.0152%2
①百万美元时,销售额增长率=Sales2002=205=
4.5918%lOOx[lnSales2oo2-lnSales ooi]=100xln205-ln196=
4.4895%2
②百万美元时,销售额增长率=二Sales2002=
25027.551%lOOx[lnSales2oo2-lnSales2ooi]=1OOxln25O-ln196=
24.335%
③百万美元时,销售额增长率=Sales2002=500=
155.102%lOOx[lnSales2oo2-lnSales ooi]=100xln500-ln196=
93.649%2当增长率变化较小时,这种近似效果好;当增长率变化增大时,这种近似精度下降了
32.模型表示即变化一单位,预期变化1lnPrice=
10.97+
0.00042Size SizePrice
0.042%o房屋扩建平方英尺△则房屋价格预期增加500Size=500,Price500*
0.042%=21%价格百分率变化为500*B Size,而的置信区间为[航/Bsize95%e196SE P,Bsize+1,96SE P]size size其中=
0.00042,SE=
0.000038・・・Psize e[
0.00034552,
0.00049448]即价格百分率变化的置信区间为95%[
17.276%,
24.724%]用接受房屋价格更好,因为该模型的调整更大2InSize R2模型中对价格的解释效应瓦涮为即32Pool
0.
0717.1%该效应的置信区间为瓜门PPOOI95%.96SE“a,PPool+1-96SE PPool]其中=
0.071,SE=
0.034/.Ppooie[
0.436%,
13.764%]模型中增加一个卧室的效应估计为
20.36%其^©改枷一二=.水平下临界值tBedrooms=
0971.965%tSEP
0.037Bedrooms该效应统计不显著因为该效应是在房屋面积不变前提下估计出来的,对房屋价格有显5Size InSize著影响,若它不变,卧室数量对价格的效应就比较小6二次项不重要,因为其lnSize2t2===
0.
055711.96其估计效应在水平下统计不显著5%非景观房添置一个游泳池后价格预期增加=
7.1%,景观房添置一游泳池价格预期增力口尸“/%+小必.%=.100/100/
47.1%+22%=
7.32%差异差异值的值为八
0.22%,t瓦空一水平下临界值0100022=0022Vl.965%tpo.view=View tSEB,.
0.10p vrPoolxView统计上差异不显著
3.1Testscore‘%,叫+凡%2STR-+ST=
1、、存在多重共线性,所以死机
4.1AlnAHE=99人人伍[/3^PotentialExperience+PotentialExperience+APotentialExperience-PotentialExperience^]二
220.0232X1-
0.000368X[2+1-2]=
0.02136期望变化AHE
2.136%225A InAHE=
0.0232x1-
0.000368x[10+1-10]=
0.015472期望变化AHE
1.5472%o因为该模型中不是的线性函数,而是二次函数6AHE PotentialExperience差异值为{产-弓-产-可}氐氐7[10+110[2+12=16水平下临界值即在水平下统计显著,因此5===
20.
441.965%15%1和差异在水平下统计显著25%若此人为女性或来自南部,到的答案没有变化,因为其自变量只有614Potential改变,与性别、区域均无关Experience在回归模型中增加交互项7FemalexPotential Experience与emalexPotential Experience
25.1
①图表示阅读量与每篇引文价格的关系,即反映需求弹性c InIn刊龄的需求曲线比刊龄二的需求曲线平缓,即刊龄二的需求弹性比刊龄二的需求弹性小,由此可=805805以推断老刊物的需求弹性比新刊物小
②模型中3P\nPricePefCitation水平下临界值ln PxicePe=
6.
006252.561%t一°ArCitation汝如〃SEB|nPricePerC[\nPucePerCitation]30水平下临界值[\nP ricePerCitation]*3A=
0.
67251.965%tS EP[ln PricePerCikaion13的系数在水平下统计显著,而的系数在水平下还lnPrice percitation1%[lnPrice percitation]35%统计不显著因此可认为阅读量对数是价格对数的线性函数而非立方函数
③模型3:tin Characters4-1000000===
2.
3981.96模型4:tlnCharacters+1000000===
2.
3851.96无论模型还是模型与在水平下皆显著正相关,所34,lnCharacters4-1000000Inquantity5%以与也显著正相关,即固定价格和刊龄情况下,字符更多的刊物需求量更Characters quantity大2
①年老刊物的需求弹性为
②篇加⑻80-
0.899+
0.141Xln80=-
0.28SEA Quantity=SE2PriceicePerCMM+AgcciA3Age xlnPr icePerCitatioii/X TV=SE2+M Z^ln PerCilHionAgex\nPricePerCitcition八2夕]M8°101nPi:icePerCi3ion+n AgexlnPi*icePerCaio〃]F人A山山,〃QlnPricePerCi+180/]nAgex]nPricePerCi-
0.899+ln80x
0.
14120.079=
0.0036则邛
21.945TestScore o+B1+B2X1+B3X2PctEL+u=3o+piPctEL+p2XiPctEL+p3X PctEL+u2其中表示时享受午餐资学生百分比对的影响系数,表81PctELW20%PctEL TestScoreB1+82示时对的影响系数,表示时对20%vPctELv50%PctEL TestScore31+P3PctELN50%E TestScore的影响系数
②模型中的线性形式存在约束即的系数与无关对7B1=B1+B2=B1+B3,B2=B3=0E EB2=B进行联合检验,判断值大小是否大于临界值,即可检验非线性系数是否优于线性系数3=0F2
①构造交叉变量引入模型重新进行回顾分析STRXlnIncome,7,
②检验上述非线性模型中交叉项系数是否统计显著,即可验证该模型是否优于STRXlnIncome线性模型
7.1
①女性的比男性平均少In Earnings
0.44
②回归标准误为收入对数估计的标准误差为
2.65,
2.65o
③=二系数在水平下统计显著=
8.
82.56,1%这个回归暗示女性高管赚的钱比男性少,可能由女性的工作经验少、教育水平较低等原因造成
④没有暗示性别歧视它忽略了很多重要的且与性别相关的变量如工作经验,必然会使性别的影响虚增2
①增加增加MarketValue1%,Earning0037%
②模型忽略了重要的遗漏变量企业市值与股票收益,其与性别有关,性别对收入的影响1中掺杂了企业市值与股票收益对收入的影响,因此比模型中系数大2
③二二系数统计不显著,可忽略=
1.
31.96,Return引入正相关变量后,的系数下降了,即女性相较男性的收入差距缩小了,Marketvalue Female给女性带来的正相作用抵消了部分性别带来的劣势,表明大的企业更Marketvalue Marketvalue有可能雇佣女性高管估计效应为Y=BO+B1X+B2X2,因此,令定义变量、为自变量,为因变量,重新Y=BO+B1+2182X+B2X2-21X,X2-21X XY做回归分析求出的回归系数及其标准误即可得估计效应的置信区间X SE,B1+21B25%[-L96SE,+
1.96SE
10.△y3AxlX21尸尸AY2A^2+3X1AX2AX.-AX94J々[⑶Ay=4AX]+^2AX2+X]+AXjX2+AX2-X}X2]坪B=4AX]++63X|A^2+X2A%1+AX]A%2=笈+尸乂尸AX+/3,AX^X32AXI+/72+3XP212第十章习题
1.1模型显示,啤酒税上调美元/杯,交通事故死亡率每万人死亡人数估计会减少
410.45万人口,交通事故死亡人数估计会减少人o810810=810*
0.45=
364.5的置信区间为[],其中二295%-L96SE,+
1.96SE=-
0.45,SE022交通事故死亡人数减少量的置信区间为3[-
0.8812,-
0.0188],81095%[
15.228,
713.772]o4模型显示,喝酒年龄降到岁,交通事故死亡率每万人死亡人数估计会增加
4180.028o万人口,交通事故死亡人数估计会增加人810810=810*
0.028=
22.68的置信区间为[其中595%-
1.96SE,+
1.96SE],=
0.028,SE=
0.066交通事故死亡人数增加量的置信区间为6[
0.10136,
0.1536],81095%[
82.1016,
124.416]O7模型显示,人均实际收入上涨交通事故死亡率每万人死亡人数估计会增加41%,万人口,交通事故死亡人数估计会增加人
1.81810810=810*
1.81=
1466.1o的置信区间为90%其中[-
1.64SE,+
1.64SE],=
1.81,SE=
0.47交通事故死亡人数增加量的置信区间为[
1.0392,
2.5808],81095%[
841.752,
2090.448]o4五个回归模型对时间效应做了经验,其值均小于所以时间效应在的水平下=0F p
0.05,5%统计显著,回归中应包含时间效应不是,模型估计更可靠模型相比模型遗漏了个变量,且这两个变量在模型54542中回归系数都是统计显著的,模型遗漏了重要的变量,估计不可靠其啤酒税系数显著45性水平高重要是因为系数提高,不是模型可靠性提升地区是一个作用于失业率对交通事故死亡影响力的调节变量,构造虚拟二元变量定义6West,位于西部地区位于其他地区创造交互项作为自变量加入West=l,West=0UnemploymentX West,到模型中进行回归,对其系数做经验,检测系数是否显著,从而判断续保地区变量是否具有F调节效应它是无量纲4R2=
0.023,51AWE.=
696.7+
9.6x25=$
936.7二$2AWE,=696,7+
9.6x
451128.7不能因为我们的回归线是根据抽样调查作出的估计,而岁远离样本的年龄区间,因此我们的抽样样本对59999岁工人不具有代表性,不能用该回归线对岁工人收入作出可靠预测99不合理因为收入分布不对称6艰7AWE=
696.7+
9.6x=
696.7+
9.6x
41.6=$
1096.
064.R-Rf=BRm-Rf+u,313212VarR-Rf=Var[pRm-Rf4-u]=p xVarRm-Rf4-Varu4-2pxcovu,Rm-Rtv covu,Rm-Rf=0,Varu0・・
2.VarR-Rtp xVarRm-RtVarRm-Rf有可能222只要VarR-Rf=p xVarRm-Rf+Varu=VarR-R-VarRm-Rf=p-1VarR-Rf+Varu32-1VarRm-Rf+Varu0f m就可以使BP Varu1-B2VarRm-Rf,VarR-RfVarR-RfmRm=
7.3%,Rf=
3.5%Rm-Rf=
3.8%=Rm-Rf=
3.8%
①」Kellogg:p=-
0.03n R-R=-
0.03x
3.8%=
0.114%
②Wal-Mart:P=
0.65=R-R=
0.65x
3.8%=
2.47%r
③Waste Management:p=
0.7R-R=
0.7x
3.8%=
2.66%f©Spring Nextekp=
0.78=R-R=
0.78x
3.8%=
2.964%z
⑤Barns andNoble:p=
1.02^R-R=
1.02x
3.8%=
3.876%z・©Microsoft:B=127n R-R/=
1.27x
3.8%=
4.826%
⑦Best Buy:B=
2.15=R-R/=
2.15x
3.8%=
8.17%
⑧Amazon:8=
2.65n R-R,=
2.65x
3.8%=
10.07%
5.
①表示除考试时长之外其他影响考试成绩的因素1u
②不同学生学习能力与学习勤奋程度等因素不同,所以拥有不同的
32、5不相关、相互独立」3X nXiu nEuXi=Eu1=0满足4
①3相互独立Varu|Xi=Varu=o2Xi.第十四章习题
2.正确1月变化率为,百分率变化为当变化较小时可以用对数的一阶差分近似表IP X100,示,即二故年百分率变化一年个月为
12./优有/有12xln-x100=1200xln_J=Yt心+.2=
1.377+
0.318^
000.12+
0.1230011+
0.68—
000.101—
00.9出+红30°叫=
1.377+
0.318x1200Inq°°°
0.123x1200Inq°°°+
0.068x1200In+
0.001x1200In-^2ip jpipip112000:11112000:10,12000:9112000:8=-
1.58,这个系数在的水平下统计不显著35%在统计水平下数据稳健水平下存在突变证据410%,5%,,T=41X12=
4924.1078,=
4.
09074.0983,=
4.
07274.1058,=
4.
07174.1183,=
4.
07574.1305,=
4.
07933.
4.1409,=
4.0812按准则,应选择个滞后期;按准则,应选择个滞后期两种选择结果不同
4.BIC2AIC3;心”=-水平下含截距与趋势的临界值
5.
12.5714A-
3.1210%
0.007所以接受单位根假设,具有随机性趋势lnIP支持具有随机性趋势,习题用的一阶差分2lnIP2lnIP来表示,有利于消除随机游走趋势,渐趋平稳但平稳抑或随A lnIPt=AlnIP机游走,有待进一步检验,不过此举确实削弱了随机性趋势个自由度是水平下统计量临界值
11.
942.
352.3745%F△的四个滞后值系数在水平下统计不显著,在水平下统计显著,所以在水平下推断利率不助于预测Rt5%10%5%增长,在水平下推断利率有助于预测增长IP10%IP
22.
872.37增长的四个滞后值系数在水平下统计显著,所以在水平下推断利率有助于预测利率IP5%5%
②、相互独立,不相关covui,uj|Xi,Xj=covui,uj=O Xiui uiuj
③a不相关COVu,Xi=0Xi4
①人—XL_=49+
0.24x90=
70.6Q01Y lx=o=49+
0.24x120=
77.82212Yd_=49+
0.24x150=85x1S2AY=10A X10x
0.24=
2.41=第五章习题
1.国的置信区间为・195%[Ri
1.96SERi,p
1.96SEp]l+l=-
5.82,SE=
2.21,\-
10.152pi-
1.4884机-0-
5.82-0------------------------1=x-==^.booOSE
02.21
①卜|
①①p=2-=2-
2.6335=2x[1-
2.6335]«2x1-
0.995731=
0.
0085380.
010.05无论在还是的显著性水平下都拒绝原假设15%1%3八…6--
5.6-
5.82+
5.6二—=--------
①二-------t==-
0.01豆SE
2.21
①①①p=2-=2-
0.01=2x[1-
0.012x1-
0.5040=
0.992
②在不进行任何其他运算情况下,可以确定包含在的置信区间内,因4-
5.695%为1中已算出的置信区间为5B195%[-
10.152,74884]的置信区间为・,6Bo99%[6O
2.58SEBO BO+
2.58SEBO]=-
520.4,SE=
20.4/.
467.7po
573.O
2.⑴性别差距估计值=尸$B
2.12/h寸生别差距=由=;:性别差距=由肌2Ho0Hi…八1-
02.12-0------------------------t=i.==
5.89国SE
0.36
①①p=2-M=2-
5.89=2x[1-
05.89]2x1-
0.9999=
0.0001拒绝原假设,性别差距显著不同于20的置信区间为瓜3pi95%,,-
1.96SE6+
1.96SE]=
2.21,SE=
0.36・邹隹..
1.
41442.8256即性别差距的置信区间为95%[
1.414428256]⑶女性平均工资为男性平均工资为+=$
12.52/h,=
12.52+
2.21=$
14.73/h=
14.73-
2.21X Female,R2=
0.06,SER=
4.2人_________________________]工都不变=—£质吆分也不变Wage^Wage Wage=i/=112位.-死不变=不变/.SER=—!—£SER普”2・・2不变2邺不变.TSS=£-Wage^R=1-iTSS/=i
4.1△Earning^=-
3.13+
1.47x16=$
20.39/h Earnings=P jAY earsEducationYearsEducaion=x62=
1.47x2=$
2.94/h3
①不吻合多接受年大学教育,按回归预测结果平均多赚与差距44=4X
1.47=$
5.88/h,$10/h很远
②的置信区间为[・]其中8195%
1.96SE,+
1.96SE,=
1.47,SE=
0.
07.\
1.3328Pi
1.6072/.
5.533124pi
6.4288即多接受年大学教育,平均每小时多赚[]美元,在的置信水平下
45.53312,
6.428895%与回归结果吻合
5.1小班有利于提高成绩,估计平均提高分,其标准误为提高幅度较大
13.
92.5,2X]+X2+・・・+X〃邛+%+〃
13.9-02+,・・+〃〃=0+显著性水平对应的双侧临界值=
5.
561.965%tSE
62.5X+X+--+X12n-+〃今H\-u1・・・-----------------------------Ep|X,X,---,X=p+E^^=B+=EU1+U2+……+Un12nXX拒绝原假设,班级规模对测试成绩的效应估计统计上显著对测试成绩效应为由3SmallClass的置信区间为[]其中B199%-
2.58SE,+
2.58SE,=
13.9,SE=
2.
5.\
7.45pi
20.35即对测试成绩效应的置信区间为[]SmallClass99%
7.45,
20.
356.不一定没有资料表明大班与小班的测试成绩变异是否相同1式既适应于同方差,也适应于异方差,所以不会影响置信区间的准正确性
25.
37.Pl显著性水平对应的双侧临界值1Id=°==
2.
131.965%tSEP,|
1.5|拒绝原假设,在的水平下5%B1W0的置信区间为[]其中2B195%-
1.96SE,+
1.96SE,=
3.2,SE=
1.5/.
0.26Pi
6.14会感到诧异3若与相互独立Yi XincovYi,Xi=covBo+BiXi,X=BiDX=0而因此必然要求的=这与的检验结果矛盾DXHO,01样本中拒绝中的比例为由求出的置信区间包含的比例为1H05%,281=095%
8.的置信区间为[]其中1B095%-
1.96SE,+
1.96SE,=
43.2,SE=
10.
7.\
22.228po
64.1721556L555・显著性水平对应的双侧临界值门四2\t\=^-=-=
0.878^.os=1965%t SE7,4]考・・・不拒绝原假设显著性水平对应的单侧临界值3t==
61.5-55=0878V%005=
1.645%tSE d
7.4a・・・不拒绝原假设
9.即是丫丫,的线性函数11,2,……Yn屋乂+、+.+工・・X+y.・+riX X]++…+Xn2pX]+〃]+pX2+〃2+・・・+PX〃+〃〃X|+X2+…+X”P X]+X+X”+〃]+/+…+”〃11£()E U=P+==pX i=\〃______________〃_二上七二一匕—丫)Z(x,-x)%-y)i06£xa—y)+x£(i=l i=lZ(X,-X)2Z(x,.-X)2/=1/=1即是条件无偏B其中*氏一歹)[()()]()〃=t Po+PiXj+%—po+0£=£R Xj—M+/z=l z=l i=\(几)=B](Z Xj—〃X)+Zu i=pj X—nX+£u i=0/=1z=l i=\n___n__2__n___2___〃族E(X,.-X)2=£(X;+X-2XjX)=ZX;+-2XZX,z=l/=1/=i/=!n_____n_2;2nX=Z X+nX1-2n X=^i=\i=l歹^X^-nYXfx,a—Ki=\=i=l i=l=i=l〃一一〃一一«一99;£(Xj-X)2£x_nX£x_nXz=l i=\i=l用表示个样本中的样本个数,表示的样本个数,则:n1n X=0n2X=1n1+n2=n,〃%〃2,2_这(义匕)+£匕)=£匕印Zx,z2%i=l k=l y=l j=l()—%n Y+n Y\x nY\---------------------2v v江--江—,机=二------===%—〃(・a)2〃—%%n已知歹区=Bo+Bn8=7-8区/)+%”-(区-歹)公=(%+〃=也不nn nn2»・・・为一斤+乎Bo+,=00=%
11.歹卬一斤〃1Bi==
485.10-
523.10=-38SEP,=SE Y-Y=J^+^-=J—+*
7.65w m吗N%V1201312=
523.10SEBo=SEYm=7v=V68T=
6.22第六章习题九I—1SSR~~n-k-\TSS4000-11----------------・・・R11-
0.176^
0.17564000-2-124000-17=1-1-
0.190^
0.189424000-3-1R=l-4000-11-
0.194^
0.19284000-6-1面〃=i SSR/-k-\,-TSS/zi-11加叫Betsy=
4.40+
5.48x1-
2.62x1+
0.29x34=$
17.
124.⑴地区间平均收入存在重大差异东北部工人平均每小时比西部工人多挣;中西部则比西$
0.69部多;但南部比西部少$
0.60/h$
0.27/h因为美国将国家经济分成东北部、中西部、南部以及西部四个片区,如果不居住在东北部、中西部、南部,那一定居住在西部,所以无需变量即可涵盖所有的样本3West如果加上它,会发生多重共线性问题,无法用最小二乘法作出线性回归估计4即每小时期望收入比少$5=-
0.27-
0.60=-$
0.87Juantia Jennifer
0.87Betsy
5.1APrice=p Ato/z=
23.4x1=$
23.422APrice=^ABath+^NHsize=
23.4x1+
0.156x100=$392△・即损失美元30rice=$
48.
848.8记二]SSR/n-k-D―〃一i1SSR4------------------------=1TSS/n—ln-k-\TSS・・.R2=1—1—铲I=1-1-
0.7222°―6T
0.7277〃—1220-
16.⑴因为影响犯罪率的因素除了警力大小外,还有其他重要的影响因素比如经济发展水平经济发展水平高的县,犯罪率会相对提高,同时也增大警察力量但在遗漏经济发展水平情况下,经济发展水平提高带来的犯罪率上升,会被归咎到警察力量上面来,所以高估了警察对犯罪率的影响
7.该研究设计不合理影响工资的因素很多,如岗位类型、休假时长,而这些其他因素很可2能与性别相关遗漏这些与性别相关但又影响工资的因素,会高估性别对工资的影响,从而得出工资性别歧视的结论还需要收集其他影响工资的数据信息,采用多元回归分析数据该研究尽可能地控制了遗漏变量偏差,但仍存在一些重要的遗漏变量如入狱原因,它直接影响入狱时间,同时也会影响出狱后的工资比如,因盗用公款入狱的人出狱后通常难以找到高薪的工作理想情况下,还需要收集这些变量的数据作为控制变量,采用多元回归的方法分析
8.不会影响死亡率的因素很多,比如疾病,而疾病与睡眠时长也会相关有的疾病使人渴睡,有的疾病则使人难以入睡该项研究遗漏了重要的影响因素,研究结果并不可靠第七章习题
1.模型1:tCP^U P1-Q I=546~°=
262.58(1%水平下t临界值)
(四)SE
0.21山-唯-
2.64-02=
13.
22.58()SE p
0.
202、对的回归系数都在水平下统计显nCollege FemaleAHE1%著模型2:)
5.48-0=-----------=
26.
0952.58(机)SE
0.21区-@-
2.62-0=
13.
12.58()SE p
20.20二FA A山.nPricePerCi+1^^/^\nAgexlnPricePerCittion△SEQuantity=
0.06・3lnCharacters-=-1000000=lnCharacters-=-100010000=lnCharacters-=-1000-ln1000=lnCharacters4-1000-10ln10因此截距项减小其他均不变
0.229X10ln10=
1.58,
6.1
①表示享受午餐资助学生百分比,表示影响测试成绩的其他因素,引入虚拟变量PctEL uXl.X2o二二构造变量、XI,X2o XIPctELX2PctEL,假设班级规模对测试成绩的效应估计统计上不显著;HO:B1=0H1:B1W
02.⑴大学毕业工人平均比高中毕业工人每小时多挣$
5.46⑵男性平均比女性每小时多挣$
2.64年龄不是收入的重要决定因素,因为年龄增加一岁,每小时工资平均只增加1$
0.292AHE\=
4.40+
5.48x1-
2.62x1+
0.29x29=$
15.67Sally。
个人认证
优秀文档
获得点赞 0