还剩77页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
第一章统计和数据本章主要内容
1.统计的含义
2.定性与定量数据、观测与实验数据
3.数据的直接与间接来源、搜集数据的方法重点
1.统计分析数据的方法描述统计与推断统计
2.数据的类型定性与定量变量、观测与实验数据
3.数据的来源直接来源与间接来源
4.搜集数据的方法普查、抽样调查、统计报表、重点调查、典型调查难点
1.描述与推断统计的区别
2.定性变量与定量变量的区别
3.典型抽样的形式第一节统计的含义知识点一什么是统计
1.含义统计是用来处理数据的,关于数据的一门学问按大百科全书的定义统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法[例题•多选题]下列关于统计学的描述,正确的有()0a.统计学是用来处理数据的,是关于数据的一门学问b.统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法c.统计分析数据的方法大体上可分为描述统计和推断统计两大类在确定组距是,一般应掌握的原则一是要考虑各组的划分是否能区分总体内部各个组成部分的性质差别如果不能正确反映各部分质的差异,必须重新分组二是要能准确地清晰地反映总体单位的分布特征在确定组距时,在研究的现象变动比较均匀的情况下,可以采用等距分组;而当研究的现象变动很不均匀时,例如急剧的增长或急剧的下降,波动的幅度很大时,则一般采用不等距分组在实际工作中,要结合实际情况确定各组的组距[例题•判断题]能够对统计总体进行分组,是由统计总体中的各个单位所具有的同质性特点决定的答案错误解析在确定组距是,一般应掌握的原则一是要考虑各组的划分是否能区分总体内部各个组成部分的性质差别如果不能正确反映各部分质的差异,必须重新分组最后,统计出各组的频数及频数分布表在统计各组频数时,恰好等于某一组的组限时,则采取上限不在内的原则,即将该频数计算在与下限相同的组内[例题•单选题]在统计分组中,如果某一数值恰好等于某一组的组限时,则采取a.下限不在内的原则b.上限不在内的原则c.上下限都可以在内的原则d.上下限都不在内的原则答案b解析分组采取的是“上限不在内”的原则.[例题・多选题]确定组距时a.要考虑各组的划分是否能区分总体内部各个组成部分的性质差别b.要能准确清晰地反映总体单位的分布特征c.在研究的现象变动比较均匀时,可采用等距分组d.在研究的现象变动不均匀时,可采用不等距分组e.各组的下组限一般不包括在本组当中答案abed解析分组采取的是“上限不在内”的原则.[例题-单选题]某连续变量分为五组,第一组为40-50,第二组为50-60,第三组为60-70第四组为70-80,第五组为80以上,依照规定()a.50在第一组,70在第四组b.60在第二组,80在第五组c.70在第四组,80在第五组d.80在第四组,50在第二组答案c解析分组有“上限不在其内”,所以50在第二组、60在第三组、70在第四组、80在第五组知识点二定量数据的图形表示定性数据的图形都可以表述定量数据,但效果不好常用来表述定量数据统计图形有直方图、折线图和散点图此外还有茎叶图、箱线图等,由于excel不能实现这些图L直方图对于一个定量数据,直方图是一个常见的而且非常重要的图形它的横坐标代表变量分组,纵指标代表各变量值出现的频数,这样,各组与相应的频数就形成了一个矩形,即直方图
2.折线图折线图是利用线段的升降来说明现象变动的一种统计图,它主要用于表示现象的分配情况、现象在时间上的变化和两个现象之间的依存关系等
3.散点图散点图能反映两个变量的关系,判断其变化的方向是否相同[例题-单选题]下列图形中不能在excel当中实现的是()0a.直方图b.折线图C.箱形图d.散点图答案C解析常用来表述定量数据统计图形有直方图、折线图和散点图此外还有茎叶图、箱线图等,由于excel不能实现这些图[例题・单选题]常用于表示定性数据的统计图是a.直方图b.散点图c.条形图d.折线图答案:c解析直方图、散点图和折线图都是表示定量数据的统计图[例题•单选题]常用于表示定量数据的统计图是oa.直方图b.条形图c.饼图d.环形图答案:a解析直方图只能表示定量数据不能表示定性数据第三节用统计表来表示数据知识点一统计表的构成统计表和统计图是显示统计数据的两种方式统计表是一种用密集的形式归纳数据的方法,它主要利用行和列中的数据来表述现象特征人们利用统计表的主要目的有一是在文章中使用它以支持自己的观点;二是利用它组织数据把整理汇总得出的统计数据资料,按照一定的结构和顺序,有系统地排列在一定的表格内,就形成一张统计表统计表的主要优点是能使统计资料条理化、系统化,能清晰的表达统计资料的内容,且简明易懂、节省篇幅,便于对表中资料进行对比,并易于检查数字的完整性和正确性统计表一般由五个部分组成,即表头、行标题、列标题、数字资料和表外附加构成表头,在表的上方,说明的是表的主要内容行标题和列标题,放在表的第一行和第一列,表示的是所研究问题类别的名称和指标名称表的其余部分是具体的数字资料表外附加,放在表的下方,说明资料来源、指标注释和必要的说明等内容通常,统计表左右两边不能封口[例题-多选题]下列关于统计表的说法中,正确的有a.统计表是组织数据的一种有效形式b.表头放在统计表的上方c.行标题放在统计表的第二行d.统计表的左右两边不能封口e.统计表可用来支持使用者的观点答案abde解析统计表是一种用密集的形式归纳数据的方法,它主要利用行和列中的数据来表述现象特征行标题放在统计表的第一列,第一行是列标题[例题-多选题]统计表组成部分包括a.表头b.行标题c.列标题d.数字资料e.表外附加答案abode解析统计表组成部分包括表头;行、列标题;数字资料;表外附加第四节用数字来概括数据知识点一对统计数据的分布特征的考查针对一组数据的分布特征,可以从两个方面来考查它一是该组数据的集中趋势,即该组数据的数值向其中心值的靠拢程度二是该组数据的离散程度,它反映的是该组数据的各个数值远离其中心的趋势和程度[例题•判断]针对统计数据的分布特征的考查,主要是从该组数据的集中趋势和离散程度两方面来考查的答案正确解析集中趋势和离散程度这两个方面反映了数据分布特征的不同侧面,让我们从不同视角来分析统计数据,以达到分析和运用统计数据的目的由于定性数据主要是计数,比较简单,对定性数据的集中趋势常用的方法就是计算百分比、中位数和众数中位数是将总体各单位标志值按大小顺序排列,处于中间位置的那个数(如果样本量为奇数),或者中间两个数目的平均(如果样本量为偶数)众数就是数据中出现次数或出现频率最多的数值在定性数据中,由于记录的是频数,因此众数用得多些[例题•多选题]对于定性数据,反映其集中趋势的数字特征有()a.比例b.百分比c.平均数d.众数e.中位数答案abde解析由于定性数据主要是计数,比较简单,对定性数据的集中趋势常用的方法就是计算百分比、中位数和众数注意,百分比是一种比例知识点二定量数据的数字特征由于定量数据有数值实际含义,可以进行加减乘除计算,所以反映定量数据特征的统计量很多,常用的有反映数据集中趋势的水平度量平均数、中位数、众数和分位数等反映数据离散程度的差异度量极差、四分位差、标准差和方差[例题-单选题]某组数据的离散程度是指a.该组数据的数值向其中心值的靠拢程度b.该组数据的数值远离其中心值的趋势和程度c.该组数据的数值向其中位数值的靠拢程度d.该组数据的数值远离其中位数值的趋势和程度答案b解析离散程度反映的是该组数据的各个数值远离其中心的趋势和程度反映数据离散程度的差异度量有极差、四分位差、标准差和方差[例题・多选题]对于定量数据,反映其集中趋势的数字特征有a.平均数b.中位数c.标准差d.方差e.众数答案abe解析对于定量数据,反映数据集中趋势的水平度量平均数、中位数、众数和分位数等
一、水平的度量
1.平均数平均数也称为均值,是把某一组数据进行算术平均,用以表述某一事物的平均水平,它在统计中叫做均值简单平均数把一个变量的所有观测值相加再除以观测值的数目7二一「加权平均数如果原始数据为分组数据,则采用加权平均数公式计算,其中的权数f为各组的频数用excel中的【average】函数求平均数[例题•单选题]对于一组数据
10、
25、
36、
40、
53、69,中位数为a.36b.40c.38d.
44.5答案C解析偶数位数是中间两数的平均数,即36+40/2=
382.众数数组中出现次数最多的数用excel中的【mode】函数求众数[例题•单选题]对于一组数据
16、
25、
25、
27、
27、
36、
36、
36、
41、
41、
41、41,众数为a.16b.25c.36d.41答案d解析众数是出现次数最多的数,41出现次数4次,最多
3.用哪个值代表一组数据平均数、中位数和众数是描述数据水平的三个主要统计量,要合理使用则需要了解它们的不同特点和应用场合平均数易为多数人理解和接受,实际中用的也较多,但主要缺点是更容易受少数极端数值的影响,对于严重偏态分布的数据,平均数的代表性较差中位数和众数提供的信息不像平均数那样多,但它们也有优点,比如不受极端值的影响,具有统计上的稳健性,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数和众数,这时它们的代表性要比平均数好[例题•单选题]下列关于平均数、中位数和众数的描述,错误的是a.三者都是用来反映数据的集中趋势b.平均数易被多数人理解和接受,实际中用的也较多c.众数容易受到极端值的影响d.当数据为偏态分布时,使用众数和中位数的代表性较好答案c解析平均数容易受到极端值的影响[例题•单选题]在反映数据集中趋势的水平度量中,最易受到极端数值影响的是Oa.平均数b.中位数c.众数d.分位数答案:a解析平均数容易受到极端值的影响
二、差异的度量对社会经济现象不仅需要对现象的集中趋势进行分析平均数、中位数、众数,而且还需要进行差异程度分析即离散程度分析研究事物现象的差异性,从差异性的事物现象中,寻求解决差异性的一些方法
1.极差range r=x-x,max nin极差又称全距,是最简单的离散指标,它是一组数据中的最大值和最小值之差计算极差非常简单,含义也很直观但是,它仅仅受最大值和最小值的影响,不能反映一组数据分布的情况,而且它非常容易受数据中极端值的影响因此,它不能准确地描述数据的分散程度
2.方差和标准差为了反映数据中的每一个观察值与平均水平的差异程度就必须引入方程和标准差的概念方差将各个变量值和其均值离差平方的平均数,作为样本数据,它反映了样本中各个观测值到其均值的平均离散程度其计算公式为未分组的计算公式«点一办20=----------R分组的计算公式标准差是方差的平方根,它与方差相比更具量纲性,而且与变量值的计量单位相同,使用的范围比方差更广泛其计算公式为未分组的计算公式V力-1分组的计算公式:在一个统计样本中,其标准差越大,说明它的各个观测值分布的越分散,它的趋中程度就越差反之,其标准差越小,说明它的各个观测值分布的越集中,它的趋中程度就越好求法利用excel中的方差函数【var】得到方差,再利用标准差函数【stdev】得到标准差
3.离散系数离散系数也称变异系数、标准差系数,它是将一组数据的标准差除以其均值,用来测度数据离散程度的相对数其计算公式为总体数据的离散系数:样本数据的离散系数:
4.标准分数标准分数也称标准化值或z分数,它是变量值与其平均数的离差除以标准差后的值,用以测定某一个数据在该组数据中的相对位置其计算公式为S标准分数最大的用途是可以把两组数据中的两个不同均值,不同标准差的数据进行对比,以判定它们在各组中的位置[例题•判断题]一个总体的差异程度不仅受标准差大小的影响,而且还受数据本身数值大小的影响答案正确解析总体的差异程度比较最好的是离散系数,是标准差除以其均值[例题-单选题]下列说法错误的是a.极差容易受数据中极端值的影响,不能准确地反映数据的分散程度b.标准差的大小会受到数据本身数值大小的影响c.一组数据的离散系数除以均值即为标准差d.标准差相同的两组数据的差异程度可能不同答案c解析一组数据的离散系数乘以均值即为标准差[例题•单选题]已知一组数据均值为3,标准差为
1.58,则其离散系数为a.
1.90b.
0.53c.
4.58d.
4.74d.在现代社会中,几乎所有领域都会应用到统计学e.统计的应用范围很广泛,有时也会被滥用答案abode解析统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法统计分析数据分描述统计和推断统计统计是适用于所有学科领域的通用数据分析方法,是一种通用的数据分析语言
2.种类统计分析数据的方法分两种描述统计和推断统计描述统计是研究数据搜集、处理和描述的统计学方法其内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合、概括与分析,得出所关心的数据特征推断统计是研究如何利用样本数据来推断总体特征的统计学方法,内容包括参数估计和假设检验两大类[例题•单选题]研究如何利用样本数据来推断总体特征的统计学方法是()a.描述统计b.理论统计c.推断统计d.应用统计答案c解析推断统计是研究如何利用样本数据来推断总体特征的统计学方法,内容包括参数估计和假设检验两大类[例题•判断题]描述统计是研究如何利用样本数据来获得总体特征的统计学方法答案错解析描述统计是研究数据搜集、处理和描述的统计学方法知识点二统计的应用
一、统计的应用领域统计是适用于所有学科领域的通用数据分析方法,是一种通用的数据分析语言无论是在社会科学领域,还是在自然科学领域,进行某个课题的研究时,为使观答案b解析离散系数=标准差/均值=
1.58/3=
0.53[例题-单选题]已知第一组数据的均值为5,标准差为
1.58;第二组数据均值为125,标准差为
2.58,则a.第一组数据离散程度小于第二组数据b.第一组数据离散程度等于第二组数据c.第一组数据离散程度大于第二组数据d.以上都不对答案c解析vl=l.58/5,v2=
2.58/125,v2vl,第一组数据离散程度大于第二组数据.[例题•单选题]两个总体的平均数不等,标准差相等,比较两总体平均数的代表性a.平均数大的代表性大b.平均数小的代表性大c.平均数大的代表性小d.两平均数的代表性相同答案a解析离散系数二标准差/均值,标准差相等,均值越大,离散系数越小,均值的代表性越大第三章参数估计重点
1.总体参数与统计量
2.样本均值与样本比例及其标准误差难点:
1.区间估计
2.样本量的确定知识点一总体分布与总体参数统计分析数据的方法包括描述统计和推断统计(第一章)推断统计是研究如何利用样本数据来推断总体特征的统计学方法,包括参数估计和假设检验两大类总体分布是总体中所有观测值所形成的分布总体参数是对总体特征的某个概括性的度量通常有总体平均数(u)总体方差(之)总体比例
(71)知识点二统计量和抽样分布总体参数是未知的,但可以利用样本信息来推断统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括性度量统计量是样本的函数,如样本均值(^)、样本方差(s2),样本比例(p)等构成统计量的函数中不能包括未知因素由于样本是从总体中随机抽取的,样本具有随机性,由样本数据计算出的统计量也就是随机的统计量的取值是依据样本而变化的,不同的样本可以计算出不同的统计量值[例题-单选题]以下为总体参数的是()a.样本均值b.样本方差c.样本比例d.总体均值答案d解析总体参数是对总体特征的某个概括性的度量通常有总体平均数、总体方差、总体比例题-判断题统计量是样本的函数答案正确解析统计量是样本的函数,如样本均值
(7)、样本方差(/)、样本比例(p)等构成统计量的函数中不能包括未知因素[例题-判断题]在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的答案错误解析作为推断对象的总体是唯一的,但作为观察对象的样本不是唯一的,不同的样本可以计算出不同的统计量值
(一)样本均值的抽样分布设总体共有n个元素,从中随机抽取一个容量为n的样本,在重置抽样时,共有nn种抽法,即可以组成d不同的样本,在不重复抽样时,共有川(葡个可能的样本每一个样本都可以计算出一个均值,这些所有可能的抽样均值形成的分布就是样本均值的分布但现实中不可能将所有的样本都抽取出来,因此,样本均值的概率分布实际上是一种理论分布数理统计学的相关定理已经证明即样本均值的均值就是总体均值zG)=〃在重置抽样时,样本均值的方差为总体方的1/n,即7在不重置抽样时,样本均值的方差为a2N-nn N-1其中,百二T为修正系数,对于无限总体进行不重置抽样时,可以按照重置抽样计算,当总体为有限总体,n比较大而n/n^5%时,修正系数可以简化为1-n/n,当n比较大,而n/n5%时,修正系数可以近似为1,即可以按重置抽样计算当总体服从正态分布时,样本均值一定服从正态分布,即有x~n(〃,时,—n(,7)若总体为未知的非正态分布时,只要样本容量n足够大(通常要求n230),样本均值仍会接近正态分布样本分布的期望值为总体均值,样本方差.为总体方差/的1/n o这就是统计上著名的中心极限定理该定理可以表述为从均值为〃,方差为的总体中,抽取样本量为n的随机样本,当n充分大时(通常要求n30),样本均值的分布近似服从均值为〃,方差为n的正态分布如果总体不是正态分布,当n为小样本时(通常n30),样本均值的分布则不服从正态分布[例题・单选题]设一个总体共有5个元素,从中随机抽取一个容量为2的样本,在重置抽样时,共有()个样本a.25b.10c.5答案a解析:在重置抽样时,共有种抽法,共有样本乱个,即52=5X5=25个[例题•单选题]设一个总体共有5个元素,从中随机抽取一个容量为2的样本,在不重置抽样时,共有()个样本a.25b.10c.5d.1答案bN解析在不重复抽样时,共有“川个可能的样本即C二
5.5x4x3x2x1=10521(5-2)12xlx3x2x1(个)
(二)样本比例的抽样分布比例是指具有某种属性的单位占全部单位数的比重总体比例(通常用n表示)是总体中具有某种属性的单位数占全部总体单位数的比例,是一个参数,通常是未知的,也是我们想通过抽样得到的说明总体特征的数据样本比例(通常用P表示)是随机抽取的样本中具有某种属性的单位数占样本全部单位数的比例,是一个样本统计量,是随机变量,对于一个已经抽取出来的样本来讲,是可以观察到的描述所有可能样本比例的概率分布就是样本比例的抽样分布当样本容量比较大时,样本比例P近似服从正态分布,且有P的数学期望就是总体比率JI,即O(p)二兀-1一万而P的方差与抽样方法有关,在重置抽样下为力,在不重置抽样下为爪[.亓)*N fnN-l即在重置抽样时,的分布为祥肘开,)P在不重置抽样时,P的分布为p~n(%一般讲,当npN5,并nbp25时,就可以认为样本容量足够大对于无限总体进行不重置抽样时,可以按照重置抽样计算,当总体为有限总体,当n比较大,而n/n W5%时,修正系数万二T会趋向1,这时也可以按重置抽样计算方差从上述分析可以看出,随着样本容量的增大,样本比例的方差愈来愈小,说明样本比例随样本容量增大,围绕总体比例分布的峰度愈来愈高[例题•单选题]当样本容量比较大时,在重置抽样条件下,样本比例P的方差为水.力—林-力尸』m而一力a.n b.G c.期d.1汽答案a解析当样本容量比较大时,在重置抽样条件下,样本比例P的方差为月[例题•单选题]设一个总体含有3个可能元素,取值分别为1,2,3从该总体中采取重复抽样方法抽取样本量为2的所有可能样本,样本均值为2的概率值是a.1/9b.2/9c.1/3d.4/9答案C解析在重复抽样下,样本为1,2,3的概率都是1/3[例题•判断题]样本容量是指从一个总体中可能抽取的样本个数答案错误解析样本容量是样本中个体的数目一个总体可以有多个样本,各个样本的的容量可以相同可以不同[例题•判断题]在确定总体比例估计中的样本容量时,如果缺少比例的方差,常取比例值为
0.5答案正确知识点三统计量的标准误差统计量的标准误差也称为标准误,是指样本统计量分布的标准差可用于衡量样本统计量的离散程度在参数估计中,它是用于衡量样本统计量与总体参数之间差距的一个重要尺度_a样本均值的标准误计算公式为•.当总体标准差未知时,可用样本标准差S代替计算,这时计算的标准误差称为估计标准误差G=尸1-兀相应地,样本比例的标准误计算公式为一—^同样,当总体比例的方差兀1-n未知时,可用样本比例的方差pbp代替[例题•单选题]样本均值的标准误差计算公式为a.n b.、.c,V双”-1d.I N答案b1解析样本均值的标准误差计算公式为函[例题-单选题]样本比例的标准误差计算公式为a.V»b.G c.V3-0爪1-7T解析样本比例的标准误差计算公式为日答案a[例题•单选题]统计量的标准误差也称为标准误,其大小与Oa.样本量的平方根成反比b.样本量的大小成反比C.样本量的大小成正比d,总体的标准差成反比答案a_a_解析样本均值的标准误计算公式为一忑,标准误与标准差成正5比,与样本量的平方根成反比[例题•多选题]在参数估计中统计量的标准误差可用于()a.衡量样本统计量与总体参数之间的差距b.衡量样本统计量的离散程度c.衡量样本统计量的集中程度d.衡量总体参数的离散程度e.衡量总体参数的集中程度答案ab解析统计量的标准误差也称为标准误,是指样本统计量分布的标准差可用于衡量样本统计量的离散程度在参数估计中,它是用于衡量样本统计量与总体参数之间差距的一个重要尺度第二节参数估计知识点一点估计与区间估计一.点估计与区间估计参数估计是用样本统计量去估计总体的参数用样本统计量来估计总体参数有两种方法点估计和区间估计点估计是用样本统计量的实现值来近似相应的总体参数区间估计是根据估计可靠程度的要求,利用随机抽取的样本的统计量确定能够覆盖总体参数的可能区间的一种估计方法区间估计是包括样本统计量在内(有时是以统计量为中心)的一个区间,该区间通常是由样本统计量加减估计标准误差得到的与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出一个概率度量标准正态分布为n(0,1)分布,将概率分布标准化的公式为_观测值二均值标准差=al Jn7Xi将z所对应的概率称为置信度或置信水平,将/力表示的范围称为置信区间几个概率下的置信区间
1.以
68.73%的置信水平推断总体参数推断总体参数U的置信区间为(z=l)-a-7x^—=,x^—=-(6J万)
2.以
95.45%的置信水平推断总体参数推断总体参数口的置信区间为(z=2)
3.以
99.73%的置信水平推断总体参数推断总体参数u的置信区间为(z=3)
4.还有一个95%的概率度为z=l.96x-19696〒,万+】亍[例题•多选题]由样本统计量来估计总体参数的方法有()a.点估计b.区间估计c.假设检验d.近似估计e.抽样估计答案ab解析用样本统计量来估计总体参数有两种方法点估计和区间估计[例题•单选题]以
68.27%的置信水平推断总体参数的置信区间为d.Ca.答案a b..1°R0解析
68.27%的置信水平,其置信度为1,则置信区间为IG.G知识点二评价估计量的标准用于估计总体参数的估计量可以有很多,如何选择估计效果最好的那种估计量,评价估计量的好坏的标准具体有
1.无偏性,是指估计量抽样分布的期望值等于被估计的总体参数e6二
62.有效性,是指估计量的方差尽可能小对同一个总体参数的两个无偏估计量,有更小方差的估计量更有效3,一致性,是指随着样本量的增大,标准误J为越小,点估计量的值越来越接近被估计总体的参数[例题•多选题]评价估计量的标准为a.一致性b.无偏性c.显著性d.有效性e.综合性答案abd点与结论具有事实依据和说服力,必须根据调查研究或实验取得的统计数据来说明问题,这需要运用科学地统计方法来进行
二、统计的误用与滥用统计常常被人们有意或无意地滥用如,错误的统计定义、错误的图表提示、一个不合理的样本、数据的遗漏或逻辑错误等这些误用有些是常识性的,有些是技术性的,有些则是故意的作为从数据中寻找事实的统计,却被有人变成了歪曲事实的工具[例题-判断题]统计是适用于所有科学领域的通用数据分析方法答案正确解析统计是适用于所有学科领域的通用数据分析方法,是一种通用的数据分析语言第二节数据类型知识点一变量与数据变数或变量是指没有固定的值,可以改变的数它们的特点是从一次观察到下一次观察会出现不同的结果数据把观察到的结果记录下来就是数据统计数据就是统计变量的具体表现[例题-判断题]变量是数据的具体体现答案错误解析数据是变量的具体表现知识点二数据类型
一、定性变量(数据)与定量变量(数据)
(一)定性变量反映“职业”、“教育程度”等现象的属性特点的变量定性变量的特点它只能反映现象的属性特点,而不能说明具体量的大小和差异定性变量的分类分类变量与顺序变量解析评价估计量的标准为一致性、无偏性、有效性[例题•多选题]样本均值是总体均值的()a.无偏估计量b.一致估计量c.有偏估计量d.无效估计e.近似估计量答案ab解析从无偏性和一致性来看,样本均值是总体均值的无偏估计量、一致估计量知识点三一个总体均值的区间估计在对总体均值进行区间估计时,需要考虑总体是否为正态分布、总体方差是否已知,用于估计的样本是大样本(n230)还是小样本(n30)等几种情况但不管哪种情况,总体均值的置信区间都是由样本均值加减估计误差得到的一般将置信水平表示为1-a,统计量分布两侧面积各为a/2的分位数值,它取决于事先所要求的置信度(或可靠程度)因此总体均值在1-a置信水平下的置信区间可一般性地表达为(-分位数值*捻的标准误差,7+分位数值*;的标准误差)
(一)大样本的估计大样本(n230)情况下,当总体方差〃已知时,总体均值在1-置信水平下的置信区间为(J想)式中a为事先确定的一个概率值,它是总体均值不包括在置信区间的概率;l-a为置信水平;z.g为标准正态分布上两侧面积各为/2时的z值;G为估计误差大样本情况下,当总体方差未知时,上式中的可以用样本方差s,代替,总.S S体均值〃在1-a置信水平下的置信区间为([例题•单选题]以
95.45%的置信水平推断总体参数的置信区间为7-2与]l!n}c.d.答案:/x-2解析:
95.45%的置信水平,其置信度为2,则置信区间为I
(二)小样本的估计小样本(n30)情况下,对总体均值的估计都是建立在总体服从正态分布的假定前提下
(1)当总体方差已知时,样本均值经过标准化后仍服从标准正态分布,此时-o-a总体均值〃在1-a置信水平下的置信区间仍为(薪金)
(2)如果总体方差未知时,样本均值经过标准化后仍服从自由度为(nT)的t分布,即s!Jn_-T)O t分布也是对称分布,只不过计算出来的t值对应的概率要查t分布概率表总体均值〃在1-a置信水平下的置信区间为■S.S x,x+4J)月方总体均值的置信区间是由样本均值和估计误差两部分组成的[例题•单选题]小样本情况下,总体服从正态分布,总体方差已知,总体均值在置信水平1-
31.7+3%]I W“J dc.答案a解析小样本(n30)情况下,当总体方差已知时,样本均值经过标准化后仍服从标准正态分布,此时总体均值〃在1-仪置信水平下的置信区间仍为[例题•单选题]小样本情况下,总体服从正态分布,总体方差未知,总体均值在置信水平b.C.\、佃5)d.答案a解析小样本情况下,如果总体方差b」未知时,总体均值在置信水平(『a)下[例题•单选题]在其他条件不变的情况下,提高抽样推断的置信度,抽样误差范围会()O的置信区间为(a.不变b.变小c.变大d.不能确定解析估计误差“战,当抽样推断的置信度提高,而为变大,范围会变大“’2知识点四一个总体比例的区间估计在大样本n230情况下,当总体比例不已知时,在1-置信水平下,总JP+工刀J体比例的置信区间为丫匐,Y〃I O-P P体比例的置信区间为*“叫〃在大样本n230情况下,当总体比例并未知时,在置信水平下,总总体比例的置信区间是由样本比例和估计误差两部分组成的[例题-单选题]根据随机抽样调查资料,某企业工人生产定额平均完成103%,标准误为1%,置信度为
95.45%时,可以推断该企业工人的生产定额平均完成百分比a.小于101%b.大于105%c.在102%—104%之间d.在101%—105%之间答案d解析:估计误差=2*1%,则103%±2队范围为101%,105%[例题•判断题]当np》5,并且n「p25时,就可以认为样本容量足够大,样本比例近似服从正态分布答案正确解析在大样本条件下,根据中心极限定理,若npN5,nl-pN5,则二项分布可用正态分布近似第三节样本量的确定知识点一估计总体均值时样本量的确定总体均值的置信区间是由样本均值和估计误差两部分组成的
1.在重置抽样条件下,设e代表允许的估计误差,则样本量计算公式为:如果总体标准差未知,可以用样本标准差s来代替;也可以用试验调查的办法,选择一个初始样本,以该样本的标准差s作为总体标准差的估计值样本量与置信水平成正比,与总体方差成正比,与允许的估计误差的平方成反比[例题•计算题]对某大学的消费支出进行估计,已知该校的大学生消费支出的标准差为300元,现在想要估计消费支出95%的置信区间,允许的估计误差不超过30元,则应抽取多大的样本量?解:已知=300,e=30,z“2=
1.
96.则a一区,1962x3002E2=303=
384.16^385人即应抽取385人作为样本(注意,不是四舍五入)[例题-多选题]决定样本量大小的因素有()a.置信水平b.总体方差c.允许的估计误差d.总体均值e.总体比例答案:abc解析在重置抽样条件下,设e代表允许的估计误差,则样本量计算公式为[例题•判断题]样本量与置信水平成正比,与总体方差成反比,与允许的估计误差成正比.()答案错误m.解析样本量E2,样本量与置信水平的平方成正比,与总体方差成正比,与允许的估计误差的平方成反比.知识点二估计总体比例时样本量的确定在重置抽样条件下,设e代表允许的估计误差,则样本量计算公式为样本量越大,估计误差就越小,估计的精度就越高估计误差由使用者预先确定大多数情况下,估计误差的取值一般应小于
0.
1.如果总体比例兀的值不知道,可以用样本比例s来代替,或者取冗=
0.5,使得JI1-JI达到最大[例题计算题]某冷库对贮藏一批禽蛋的变质率进行抽样调查,根据以前的资料,禽蛋贮藏期变质率为
5.3%
4.9%,现在允许误差不超过5%,推断的置信水平为95%,问至少要抽取多少禽蛋进行检查?解已知兀1=
5.3%,冗2=
4.9%,e=5%,z=l.
96.a/2因为Jii l-nj=
0.053x1-
0.053=
0.050n l-n=
0.049x1-
0.049=
0.047,选方差最大的0・050,则22匕,2爪1-m L962x
0.050力二■—一――,E2=005a=
76.83处77个即应抽取77个禽蛋作为样本[例题•多选题]计算样本容量,如果总体比例的值未知,可以b・取总体比例值为
0.5,使得兀1-兀达到最大c.取总体比例值为
0.1,使得兀1-兀达到最大a.用样本比例来代替d・取总体比例值为
0.2,使得n1-兀达到最小e・取总体比例值为
0.3,使得兀(1-n)达到最小答案ab解析计算样本容量,如果总体比例的值未知,大多数情况下,估计误差的取值一般应小于
0.
1.如果总体比例兀的值不知道,可以用样本比例S来代替,或者取兀=
0.5,使得n(1-兀)达到最大[例题•判断题]在确定总体比例估计中的样本容量时,如果缺少比例的方差,常取比例值为
0.5o答案正确解析取兀=
0.5,使得Ji(1-兀)达到最大第四章假设检验重点:
123、假设检验的过程、总体均值的假设检验、大样本与小样本检验、总体比例的假设检验难点:
12、假设检验的过程、总体方差已知与总体方差未知的检验统计量的区别第一节假设检验的基本原理知识点一假设检验的含义假设检验是统计推断的另一项重要内容,它与参数估计类似,只是角度不同参数估计是用样本统计量估计总体参数的方法而假设检验是先对总体参数或分布形式提出某种假设,然后利用样本信息和相关统计量的分布特征检验这个假设做出是否拒绝原来假设的结论一.为什么要进行假设检验进行假设检验是为了找出样本均值与总体均值之间存在误差的原因二.如何进行假设检验运用小概率事件来检验小概率事件是指在一次事件中几乎不可能发生的事件,一般称为“显著性水平”,用a来表示显著性水平一般取值为a=
0.05或a=5%三.假设检验的过程.1提出原假设和替换假设(备择假设)在统计学中,把需要通过样本去推断其正确与否的命题称为原假设(零假设),用h表示h:口二某一给定数与原假设相对立的就是备择假设,用表示0hiU W某一给定数(双尾检验)必口>某一给定数或〈某一给定数(单尾检验)对于任何一个假设检验问题,其所有的结果都应包含在这两个假设范围内因此,在h和团中,总有一个假设,且只能有一个假设成立接受h,就表明否定了L,反之亦然,否定h,就表明接受了hlo.2确定适当的检验统计量用于检验假设问题的统计量称为检验统计量如同在参数估计中一样,需要借助于样本统计量进行统计推断在大样本中,检验统计量服从正态分布,用z统计量在小样本中,检验统计量服从t分布,用t统计量这和参数估计的考虑情况是一样的.3确定显著性水平根据样本所得的数据来拒绝零假设的概率应小于
0.05,当然也可能是
0.01,
0.005等显著性水平就是允许的小概率水平,但小概率并不能说明不会发生,仅仅是发生的概率很小罢了统计推断中的假设检验是根据样本的数据信息对关于总体参数的某种假设进行的判断,由于样本的信息与总体参数的真实情况不完全一致,无论我们做出的拒绝或不拒绝原假设的结论,都有可能犯错误第一类错误弃真错误,即h°本来正确,却拒绝了它,犯这类错误的概率不超过a,即p{拒绝h0|h为真}Wa第二类错误取伪错误,即h本不真,却接受了它,犯这类错误的概率不超过B,即p{接受4|hi为真}W a在一般的假设检验问题中,犯第一类错误的概率最大不超过a,但由于备选假设往往不是一个点,所以无法算出第二类错误的概率B o一般情况下,人们认为犯第一类错误的后果更严重一些,因此通常会取一个较小的a值人们通常选择显著性水平为
0.05或比
0.05更小的概率
4.根据数据计算检验统计量值和与这个统计量值对应的概率p值,并进行决策
①设有总体x〜nu,o2,a已知;
②随机抽样样本均值工〜nu,o2/n;分类变量没有量的特征,只有分类特征这种只反映现象分类特征的变量又称分类变量分类变量的观测结果就是分类数据说明事物类别的一个名称如“性别”就是一个分类变量分类变量没有数值特征,所以不能对其数据进行数学运算顺序变量如果类别具有一定的顺序,如,“教育类别”,这样的变量称为顺序变量,相应的观察结果就是顺序数据说明事物有序类别的一个名称,这类变量的具体表现就是顺序数据顺序数据之间虽然可以比较大小,却无法计算相互之间大小、高低和优劣的距离这样的数据仍然用来表示事物在性质上的差异,而不能用来反映事物在数量上的差异
(二)数值(定量)变量反映“天气温度”、“月收入”等变量可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异这些变量就是定量变量也称数值变量,定量变量的观察结果成为定量数据是说明事物数字特征的一个名称定性变量与定量变量的区别
1.分类变量没有数值特征,所以不能对其数据进行数学运算分类数据只能用来区分事物,而不能用来表明实物之间的大小、优劣关系
2.顺序变量比分类变量向前进一步,它不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系显然,顺序数据的功能比分类数据要强一些,对事物的划分也更精细一些但顺序数据的数据之间虽然可以比较大小,却无法计算相互之间的大小、高低或优劣的距离只是反映事物在性质上的差异,而不能用来反映事物在数量上的差异因此,从本质上,顺序数据仍然是定性数据中的一种
3.数值型数据作为统计研究的主要资料,其特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差,而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差其计量精度远远高于定性数据在统计学研究中,对数值型数据的研究是定量分析的主要内容从上述三种数据的基本特点可以看出,这三类数据对事物的描述是由定性到定量、由低级到高级,从粗略到精细在统计研究中,需要明确各种数据所适用的统计方法,正确的选择和应用,这是正确进行统计研究的基本要求[例题-单选题]下列变量是定性变量的是()a.年龄
③将标准化z=〜n0,1;
④确定a值,查概率表,定临界值k
⑤将z和k值对比,作出判断确定显著性水平a,就确定了临界值k根据显著性水平和统计量的分布,可以找出接受域和拒绝域的临界点,用计算出来的检验统计量的值和临界点的值相比较,就可以做出接受还是拒绝原假设的统计决策总结上述的检验决策准则双侧检验I统计量的值I>临界值,或pW a时,拒绝原假设;左侧检验统计量的值〈临界值,或pW a时,拒绝原假设;右侧检验统计量的值》临界值,或pW a时,拒绝原假设对假设检验的总结
1.假设检验依据的是小概率原理
2.小概率标准在抽样前依需要确定
3.假设检验的结果只能是拒绝或不拒绝原来假设,而不能证明原假设成立
4.统计假设检验的结果不是绝对正确[例题-单选题]假设检验主要是对()进行的检验a.总体参数b.样本参数c.统计量d.样本分布答案a解析假设检验是先对总体参数提出某种假设,然后利用样本信息去检验这个假定,作出是否拒绝原来假设的结论[例题-单选题]在显著水平为a的假设检验中存在两类错误,其中如果拒绝原假设,则可能犯第一类错误,第一类错误的概率是()a.最大不超过a b.等于a c.最小不超过a d.不确定答案a解析在一般的假设检验问题中,犯第一类错误的概率最大不超过a[例题-单选题]小概率事件,是指在一次事件中几乎不可能发生的事件一般称为“显著性水平”,用a表示显著性水平一般取值为()a.5%b.20%c.30%d.50%答案a[例题•单选题]在假设检验中有两类错误,其中第一类错误是指()a.拒绝了正确的零假设b.不能拒绝错误的零假设c.接受了正确的备择假设d.拒绝了正确的备择假设答案a[例题-单选题]假设检验中第二类错误是指()oa.接受正确原假设b.拒绝正确原假设c.接受错误原假设d.假设设立不正确答案C解析假设检验中第二类错误是指取伪错误,即h本不真,却接受了它[例题•单选题]假设检验的依据是()a.小概率原理b.中心极限定理c.方差分析原理d.总体分布答案a[例题•判断题]假设检验的结果能证明原假设成立答案错误解析假设检验的结果只能是拒绝或不拒绝原来假设,而不能证明原假设成立[例题-单选题]按设计标准,某自动食品包装机所包装食品的平均每袋重量应为500克,若要检验该包装机运行状况是否符合设计要求,应该米用()抵左侧检验b,右侧检验c.双侧检验d.左侧或右侧均可答案c[例题•判断题]假设检验中,如果不能拒绝原假设,那么说明原假设肯定是对的答案错误解析接受原假设,并不能说明原假设正确第二节总体均值的假设检验n^30知识点一大样本检验对于总体均值进行假设检验时,采用什么检验统计量取决于所抽取的样本是大样本还是小样本,还需要考虑总体是否为正态分布、总体方差是否已知等当总体方差已知时,总体均值检验的统计量为.『访[例题•单选题]大样本情况下,当总体方差已知时,总体均值检验的统当总体方差未知时,总体均值检验的统计量为.--=计量为答案a解析大样本情况下,当总体方差已知时,总体均值检验的统计量为b S当总体方差未知时,选b T*(n30)知识点二小样本检验当总体方差已知时,总体均值检验的统计量为“一『访;当总体方差未知时,总体均值检验的统计量服从自由度为(n—1)的t分布,s/施注意无论是大样本还是小样本,先计算检验统计量,再根据给定的显著性水平查表确定临界值,比较两者的大小,确定是否接受原假设[例题•单选题]小样本情况下,当总体服从正态分布,总体方差已知时,总体均值检验的统计量为()《万d.s/«答案a值检验的统计量为‘一审F,若总体方差未知,则是一环[例题-多选题]在随总体均值进行假设检验时,采用什么检验统计量取决于()a.所抽取的样本是否是大样本还是小样本b.还需要考虑总体是否为正态分布c.总体方差是否已知d.样本均值是否已知e.样本方差是否已知答案abc[例题•单选题]当总体为正态总体,方差已知,样本量为40,此时进行均值检验,应采用()统计量进行检验a.卡方b.tc.f d.z答案d解析样本量为40〉
30.是大样本为正态总体,方差已知或未知,都采用z检验小样本当总体方差未知时,总体均值检验的统计量服从自由度为(n—1)的t分布第三节总体比例的假设检验知识点一总体比例的假设检验在抽样分布和参数的区间估计中,都讲到比例的问题,同样假设检验也有总体比例的检验,总体比例的检验与总体均值的检验基本相同,只是检验的参数和检验统计量的表现形式不同我们生活中经常需要对总体的某些比例进行检验,以证明某种观点能否被否定一个总体比例的检验,基本形式有三种双侧检验hn=n,hinJI000左侧检验hn2兀°,hin R0右侧检验h:n W五0,hin no0在大样本时,样本比例会近似服从正态分布,所以,检验统计量仍用Z统计量,其基本形式为:[例题•计算题]某调查公司对某气象站以字幕形式宣示天气预报观众满意率表示怀疑,随机调查了500名居民,结果有372人对当天天气预报节目满意,满意率
74.4%,当天气象站预报的观众满意率为80%,调查能否以
0.05的显著性水平否定气象站的宣示结果解
(1)建立原假设和备择假设原假设h():=80%JT备择假设hi:冗W80%
(2)根据抽样调查结果p=
74.4%,计算检验统计量,—744%-80%V---500=—3—3
(3)以
0.5的显著性水平确定临界值96()Za/2=Z.05/2=
1.)(4检验统计量与临界值比较||=3,131,96,因此,z拒绝原假设否定气象站的宣示结果[例题-多选题]总体比例假设检验的基本形式为()a.ho:=o hii兀W oJIJI JIb.ho:兀三兀o,hi:兀兀oc.ho兀W no,hi:兀兀od.ho:兀o,hi二兀JC JT©•ho*兀兀o,hi:兀W兀o答案abc解析a是双边,be是单边[例题•单选题]在大样本时,总体比例检验统计量用z统计量,其基本形式为()b.职业c.居民的受教育年限d.月收入答案b解析定性变量是反映“职业”、“教育程度”等现象的属性特点的变量,不能说明具体量的大小和差异[例题•单选题]为了便于数据分析,人们常用数字1表示男性,2表示女性,这个数字1和2()oa.具有数量上的差异b.具有实际数字含义c.只是一个编号d.可以进行运算答案c解析这种变量是分类变量,没有量的特征,只有分类特征[例题•单选题]若产品质量由高到低划分为三个级别1级、2级、3级,则下列说法中正确的是()oa.1级品的质量是2级品的两倍b.2级品的质量是1级品的两倍c.产品质量级别是顺序数据d.产品质量级别是定量数据答案C解析•产品质量级别是定性变量,只是反映产品之间在质量上的性质差异,却无法计算相互之间大小、高低和优劣的距离[例题-单选题]下列关于变量数据的说法错误的是()0a.分类数据只能用来区分事物,不能用来表明事物间的大小、优劣7月d.d品b.c.答案c解析在大样本时,总体比例检验统计量用z统计量,其基本形式为Pf第五章相关分析与回归分析重点
1、相关程度的测定
2、一元回归模型参数估计
3、多元回归模型参数的最小二乘估计难点:
1、回归方程的评价
2、回归方程的检验第一节相关分析知识点一统计上对现象之间数量关系的研究自然界中现象与现象之间彼此存在着相互依存、相互影响和相互制约等关系是一个普遍的现象研究变量之间的关系,并利用这种关系可以有助于我们认识客观事物发展变化的规律,帮助我们进行客观的预测和科学决策,指导、控制社会经济活动的发展对现象之间数量关系的研究,统计上是从两个方面进行的一方面是分析现象之间关系的密切程度一一相关分析;另一方面是找出现象之间数量变化依存关系一一回归分析知识点二相关关系在现实世界中,任何事物或现象都不是孤立存在的,而是相互联系、相互制约、相互依存的当某些现象发生变化时,另一现象也会随之发生变化如商品价格的变化会刺激或抑制商品销售量的变化研究这些现象之间的依存关系,找出它们之间的变化规律,是对经搜集、整理过的统计数据进行数据分析,为客观、科学地统计提供依据现象间的依存关系大致可以分成两种类型一类是函数关系,另一类是相关关系1函数关系函数是指现象之间有一种严格的确定性的依存关系表现为某一现象发生变化另一现象也随之发生变化,而且有确定的值与之相对应例如,银行的1年期存款利率为年息
1.98%,存入的本金用x表示,到期本息用y表示,则y=x+
1.98%x不考虑利息税2相关关系相关关系是指客观现象之间确实存在的,但数量上不是严格对应的依存关系在这种关系中,对于某一现象的每一数值,可以有另一现象的若干数值与之相对应例如成本的高低与利润的多少有密切关系,但某一确定的成本与相对应的利润的数量关系却是不确定的这是因为影响利润的因素除了成本外,还有价格、供求平衡、消费嗜好等因素以及其他偶然因素的影响相关关系和函数关系既有区别,又有联系有些函数关系往往因为有观察或测量误差以及各种随机因素的干扰等原因,在实际中常常通过相关关系表现出来;而在研究相关关系时,当对其数量间的规律性了解得越深刻的时候,其相关关系就越有可能转化为函数关系或借助函数关系来表现3相关关系的两个特点
①现象之间确实存在着数量上的依存关系就是说,一个现象发生数量上的变化,另一个现象也会相应地发生数量上的变化
②现象间的数量依存关系值是不确定的就是说,一个现象发生数量上的变化,另一个现象会有几个可能值与之对应,而不是唯一确定的值相关分析的主要内容⑴确定现象之间有无关系⑵确定相关关系的表现形式,运用相应的回归分析方法进一步分析现象之间的数量依存关系用一个数学表达式,来反映有相关关系的变量之间的数值变化关系,据此由一个或若干个自变量的数值推断出因变量的可能值,这种分析称为回归分析相关分析与回归分析既有区别又有联系,两种分析构成了相关关系分析的基本内容⑶测定相关关系的密切程度[例题・单选题]相关分析研究的是()a.变量间的相互依存关系b.变量间的因果关系c.变量间严格的一一对应关系d.变量间的线性关系答案a解析相关关系是指客观现象之间确实存在的,但数量上不是严格对应的依存关系知识点三相关关系的描述一一散点图对于两个变量X和y,通过观察或实验,我们可以得到若干组数据,记为(x“yi)(i=l,2,…,n)将这些数据按x值由大到小(或由小到大)以序列表表示,即构成相关表将一一对应的(x“yi)描点于坐标轴上,即构成散点图,又称相关图通过散点图所反映出的坐标点的分布状况可以直观地判断变量之间是否存在相关关系,以及相关的形态、方向
1.相关的形态按照相关形式不同分为线性相关和非线性相关线性相关一一又称直线相关,是指当一个变量变动时,另一变量随之发生大致均等的变动,从图形上看,其观察点的分布近似地表现为一条直线;例如,人均消费水平与人均收入水平通常呈线性关系非线性相关---------个变量变动时,另一变量也随之发生变动,但这种变动不是均等的,从图形上看,其观察点的分布近似地表现为一条曲线,如抛物线、指数曲线等,因此也称为曲线相关例如,工人加班加点在一定数量界限内,产量增加,但一旦超过一定限度,产量反而可能下降,这就是一种非线性关系例如根据企业的销售额和利润作出的相关散点图从图中可以看出,企业的产品销售总额与利润总额的相关点的分布,近似地表现为一条上《试升的直线由此可判断产品销售总额与利润总额之间存在着直线的正相建铺散点图是相关关系的一种描述方法,它直观、形象,通过散点图可以观察到现象的关系类区型以及相关方向、程度
2.相关的方向产品辆售总嵌C万元)按照相关的方向不同分为正相关和负相关正相关一一当一个变量的值增加或减少,另一个变量的值也随之增加或减少如工人劳动生产率提高,产品产量也随之增加;居民的消费水平随个人所支配收入的增加而增加负相关一一当一个变量的值增加或减少时,另一变量的值反而减少或增加如商品流转额越大,商品流通费用越低;利润随单位成本的降低而增加[例题•单选题]下列情况中,称为正相关的是()a.随一个变量增加,另一个变量相应减少b.随一个变量减少,另一个变量相应增加c.随一个变量增加,另一个变量相应增加5W11OOOOOOOO42086421d.随一个变量增加,另一个变量不变答案c解析正相关是当一个变量的值增加或减少,另一个变量的值也随之增加或减少,两者同方向变化是正相关,两者反方向变化是负相关[例题•单选题]相关分析中,用于判断两个变量之间相关关系类型的图形是()a.直方图b.散点图c.柱形图d.圆形图答案b解析相关分析中,用于判断两个变量之间相关关系类型的图形是散点图知识点四相关程度的测定
一、相关系数的计算相关系数是测定变量之间关系密切程度的量对两个变量之间的线性相关程度的度量称为单相关系数通常以r表示样本的相关系数在直线相关的类型中,人们使用相关系数测定变量之间的相关关系样本的相关系数的定义公式为一百一3)两;[瓯J或化简为尼一元)2二一3)2计算该相关系数时,假定两个变量之间是线性关系,而且两个变量都是随机变量此外,样本数据中不应有极端值,否则会对相关系数的值有较大影响相关系数的性质如下
1.相关系数的值介于-1与+1之间,即-IWrW+l当r0时,表示两变量正相关,当NO时,表示两变量为负相关当|r|二l时,表示两变量为完全线性相关即函数关系当r=l时,称为完全正相关,而当r=-l时,称为完全负相关当r=O时,表示两变量间无线性相关关系
2、r具有对称性x与y之间的相关系数小和y与x之间的相关系数%相等
3、r数值大小与x和y的数据原点及计量尺度无关改变x和y的数据原点和计量尺度,并不改变r数值的大小
4、r仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系r=0只表示两个变量之间不存在线性关系,并不表示变量之间没有任何关系
5、r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系当I rI NO.8时,可视为高度相关;当
0.5W I r1〈
0.8时,可视为中度相关;当
0.3|r
10.5时、视为低度相关;当Ir
10.3时,说明两个变量之间的相关程度极弱这种解释必须建立在对相关系数显著性检验的基础之上[例题•单选题]测定变量之间相关关系密切程度的主要方法是()a.相关表b.相关图c.相关系数d.定性分析答案c解析在直线相关的类型中,人们使用相关系数测定变量之间的相关关系[例题・单选题]相关系数的取值范围是()a.-oo+oo b.TWrW+1c.-Kr+1d.OWrW+1r答案:b解析相关系数的值介于-1与+1之间,即[例题•单选题]相关系数等于零表明两个变量().a.是严格的函数关系b.不存在相关关系c.不存在线性相关关系d.存在曲线相关关系答案c解析当r=0时,表示两变量间无线性相关关系[例题-单选题]若所有观察值都落在回归直线上,则x与y之间的相关系数是()Oa.r=0b.r=1c.-1r1d.0r1答案b解析若所有观察值都落在回归直线上,则X与y之间的相关系数是1,两者是函数关系[例题•判断题]在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度答案错解析相关系数说明的是变量之间线性相关的密切程度[例题・单选题]下列两个变量之间的相关程度最高的是oa.商品销售额和商品销售量的相关系数是
0.9b.商品销售额与商业利润率的相关系数是
0.84c.平均流通费用率与商业利润率的相关系数是-
0.94d.商品销售价格与销售量的相关系数是
0.91答案c解析相关程度最高的是相关系数的绝对值最大的
二、相关系数的检验检验相关系数是因为两个变量均为随机变量,计算相关系数时使用的是它们的随机抽样值,因此不能断定总体变量值也存在着这样的相关关系,需要经过显著性检验加以确定相关系数的显著性检验问题是对总体的相关系数P是否等于0进行检验相关系数的检验步骤如下
①提出假设hP=0;hiP WO0
②计算检验统计量t的值、t-/〜%一2
③在给定的显著性水平a下,查找t分布表中相应的临界值t n-2a/2
④判断,若|t|芸t,表明r在统计上是显著的,拒绝h;若|t|t“,表明r在统计上a/2a是不显著的,接受%【例题】以某地区城镇居民人均消费性支出与人均可支配收入的数据为例,计算收入与支出的相关系数,并对相关关系强度进行分析显著水平为
0.05n=13,r系数为
0.9933解
1.建立统计假设hP=0;hiP W0(双测相关)
02.计算t检验值
0.9933旧二I-3t===
28.51Jl-
0.99332显著水平为
0.05,自由度为11的临界值t“2=
2.201由于上式中的I t|=
28.
52.201,因此拒绝h,表明相关系数在统计上是显著的即人均消费性支出与人均可支配收入之间存在显著的线性相关系数第二节一元线性回归分析知识点一回归分析的主要内容回归是分析变量之间关系类型的方法,按照变量之间的关系,回归分析分为线性回归分析和非线性回归分析本节研究的是线性回归,即如何通过统计模型反映两个变量之间的线性依存关系回归分析的主要内容
1.从样本数据出发,确定变量之间的数学关系式;
2.估计回归模型参数;
3.对确定的关系式进行各种统计检验,并从影响某一特定变量的诸多变量中找出影响显著的变量知识点二一元线性回归模型一元线性模型是指两个变量X、y之间的直线因果关系理论回归模型y=80+B1x+e理论回归模型中的参数是未知的,但是在观察中我们通常用样本观察值(y「X估计参数值和Bi,通常用b,也分别表示B,Bi的估计值,即称回归估计模型估计的线性回归方程:知识点三模型参数估计
1.方程的建立用最小二乘法估计b°,bl:B°=y.可x方法对因变量y和自变量x的系列数据带入上面的公式,求出匕和b的值,回归方程即可得到
2.回归系数的含义回归方程夕=瓦+4x中的两个回归系数,其中b为y截距,表现为x=0时,纵轴上的一个点;匕是回归直线的斜率,它是自变量(x)每变动一个单位量时,因变量(y)的平均变化量回归系数b的取值有正负号如果匕为正值,则表示两个变量为正相关关系,如果b为负值,则表示两个变量为负相关关系[例题•单选题]在回归直线y=a+bx中,回归系数b表示()oa.当x=0时v的期望值b.x变动一个单位时y的变动总额c.y变动一个单位时x的平均变动量d.x变动一个单位时y的平均变动量答案d解析回归系数b表示变量x每增加一个单位,被解释变量y将相应地平均变化b个单位[例题-判断题]回归系数b的符号与相关系数r的符号,可以相同也可以不同答案错误解析回归系数b的符号与相关系数r的符号是相同的[例题•单选题]回归系数和相关系数的符号是一致的,其符号均可用来判断现象a.线性相关还是非线性相关b.正相关还是负相关c.完全相关还是不完全相关d.单相关还是复相关答案b解析回归系数和相关系数的符号是一致的,其符号均可用来判断现象正相关还是负相关知识点四回归方程的评价与检验当我们得到一个实际问题的经验回归方程后,还不能马上就进行分析与预测等应用,在应用之前还需要运用统计方法对回归方程进行评价与检验进行评价与检验主要是基于以下理由第一,在利用样本数据估计回归模型时,首先是假设变量y与x之间存在着线性关系,但这种假设是否存在需要进行检验;第二,估计的回归方程是否真正描述了变量y与x之间的统计规律性,y的变化是否通过模型中的解释变量去解释需要进行检验等一般进行检验的内容有
1.经济意义的检验利用相关的经济学原理及我们所积累的丰富的经验,对所估计的回归方程的回归系数进行分析与判断,看其能否得到合理的解释
2.回归方程的统计检验包括回归方程的显著性检验f检验和对回归系数的检验t检验1线性回归方程的显著性检验一一f检验第一步提出假设原假设h:0O两个变量之间线性关系不显著Fb.顺序数据具有数值特征,可以用于反映事物在数量上的差异C.数值型数据的计量功能要大于分类数据和顺序数据d.在统计学研究中,对数值型数据的研究是定量分析的主要内容答案b解析顺序数据的数据之间虽然可以比较大小,却无法计算相互之间的大小、高低或优劣的距离只是反映事物在性质上的差异,而不能用来反映事物在数量上的差异
二、观测数据和实验数据按获取数据的方法不同,可分为观测数据和实验数据观测数据可能是全面数据也可能是样本数据(局部),实验数据一般都是样本数据
1.观测数据观测数据是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束在社会经济问题研究中,观测是取得数据最主要的方法
2.实验数据实验数据一般是在科学实验环境下取得的数据在实验中,实验环境是受到严格控制的,数据的产生一定是某一约束条件下的结果在自然科学研究中实验的方法应用非常普遍[例题•单选题]根据获取方法不同,数据可分为观测数据和()oa.描述数据b.实验数据c.推断数据d.分析数据答案b解析按获取数据的方法不同,可分为观测数据和实验数据备择假设hi3W0两个变量之间线性关系显著第二步构造f统计量得出对应的概率伴随概率值f=ssr/l/sse/n-2=msr/mse^f1,n-2其中ssr为回归平方和,sse为残差平方和,msr为回归均方即ssr/l,mse为残差均方即sse/n-2msr第一自由度为1,mse第二自由度为n-2,n为样本容量第三步与给定显著水平a对比,作出判断若伴随概率小于事前确定的显著性水平a时,拒绝原假设h,认为Bi不为零,回归方程的线性关系是存在的;否则,接受原假设h,即回归方程不存在线性关系2回归系数的显著性检验一一t检验回归系数的显著性检验是检验解释变量x对因变量y的影响是否显著首先提出假设原假设h:B尸00备择假设hi:B HO如果h成立,则因变量y对解释变量x之间并没有真正的线性关系,即x的变化对y并没有显著的线性影响其次计算检验统计量t,并得出对应的概率伴随概率值-2[t—〜检验统计量业赋公Jv啦自为回归系数的标准差最后根据伴随概率进行判断如果伴随概率sig.值小于我们事先确定的显著性水平a时,拒绝原假设,接受备择假设,即解释变量x对y的线性效果显著否则,不能拒绝原假设,认为x对y的线性效果不显著一元线性回归分析时,由于只有一个解释变量,因此t检验与f检验的结果是一致的
3.回归方程的评价一一拟合程度分析拟合程度是指估计的回归方程是否很接近因变量,即估计的精确度而估计的精确度如何取决于回归方程对观测数据的拟合程度最常用的指标就是一一判定系数已
1.判定系数召判定系数是用来说明回归方程对观测数据拟合程度的一个度量值,以一元线性回归方程为例,若各观测值数据X1,在坐标系上形成的散点都落在一条直线上,那么这条直线就是Yi对数据的完全拟合,直线充分代表了各个点,此时,用X估计y是没有误差的各观测点越是紧密围绕直线,说明直线对观测数据的拟合程度越好,判定系数越高,反之则越差,判定系数越小总变差平方和二回归平方和+残差平方和即sst=ssr+sseo y-72=0y-72+G y一丁尸注意观测值、回归值、均值回归直线拟合的好坏取决于ssr和sse的大小,各观察值越是靠近直线,ssr就越大,及ssr占sst的比例就越大,这样,我们可以通过这一比例称评定系数r2来反映直线对观察值的拟合程度0回归平方和查以_[=整平方和‘乐开”药I丁判定系数N的取值范围在【0,1】,式二1时,拟合是完全的,即所有观测值都在直线上若X与y无关,x完全无助于解释y的变差,此时>=歹,则r2=
0.可见越接近于1,表明回归平方和占总变差平方和的比重越大,回归直线与各观测点越接近,回归直线的拟合程度就越好反之,d越接近3回归直线的拟合程度越差
2.估计标准误差估计标准误差是残差平方和的均方根,用工表示其计算公式为2_|_区®一加■差平方和%=V«-2=V从实际意义看,s反映了用估计的回归方程预测因变量y时预测误差的大小,Se越小,e说明根据回归方程进行预测也就越准确;若各观测点全部落在直线上,则此时用自变量来预测因变量是没有误差的可见S’,也从另一个角度说明了回归直线的拟合程度[例题•单选题]评价回归直线方程拟合优度如何的指标有()a.回归系数b b.直线截距ac.判定系数r2d.相关系数r答案c[例题•单选题]在一元线性回归分析中,若相关系数为r,判断系数为封,回归方程拟合程度最好的是()a.r=
0.75b.r=-
0.97c.r2=
0.75d.r2=
0.90答案d解析封越接近于1,拟合程度越好[例题•单选题]关于估计标准误差,下列说法正确的是()a.估计标准误差数值越大,说明回归直线的代表性越大b.估计标准误差数值越大,说明回归直线的代表性越小c.估计标准误差数值越大,说明回归直线的实用价值越大d.估计标准误差数值越大,说明回归直线的实用价值越小答案b解析估计标准误差Se越小,说明根据回归方程进行预测也就越准确[例题•单选题]估计标准误差的作用是表明()a.回归方程的代表性b.样本的变异程度c.估计值与实际值的平均误差d.样本指标的代表性e.总体的变异程度答案ac第三节多元线性回归分析知识点一多元线性回归模型与回归方程许多现象的变动涉及到多个变量之间的数量关系这种一个因变量同多个自变量的回归就是多元回归,当因变量与各自变量之间为线性关系时,称为多元线性回归
1.多元线性回归模型多元回归可分为多元线性回归与多元非线性回归多元线性回归方程是用于表达一个因变量与多个自变量之间相互关系及其规律性的一种数学模型设因变量为y,k个自变量分别为小,X2,…,Xk描述因变量y与x X2,…,Xk之b间线性关系的数学结构式,即多元线性回归模型y=B o+B iX]+B x+---+B x+£22k k其中,B,Bi,B2…Bk为回归系数,£为随机误差项通常假定£满足ee=0,cov£i,£j=0i=j时或cov ei,£j=o2i Wj时,这样对上式两边求数学期望得ey=B o+B iXi+B2X2+…+B kXk该式从平均意义上表达了变量y与xi,x,…,Xk之间的统计规律性理性回归模型中的参数是未知的,回归分析的主要任务就是通过样本观测值力,x»X2i…,xG对60,B62…Bk进行估计,在此用瓦,th,bz…,bk分别表示Bo,BLA1,82…Bk的估计值,则称二b+biXi+b x+---+b x22k k为估计的线性经验回归方程,或估计的多元线性回归方程
2.参数的最小二乘估计多元线性回归模型的参数B,62…仇仍然是根据最小二乘法求得采用普通最小平方法进行参数估计,使全部观测值与回归值的残差平方和最小,即*二工仇一一刎_%勺-…一打尸44in=m由此方程,根据微分极值的原理,可求得b,bI,b2…,bk的值知识点二回归方程的评价与检验
一、回归方程的评价多元线性回归方程的评价可以根据多重判定系数、估计标准误差等统计量来完O
1.多重判定系数在多元线性回归中,因变量的总变差平方和sst同样可被分解为两部分回归平方和ssr与残差平方和sse总变成平方和二回归平方和+残差平方和即sst=ssr+sse一A A_Oy—2=0y_yy+o^y-yy加—回归平方和法域zf多重判断系数判定系数d能度量多元线性回归方程的拟合程度行取值范围在【0,1],行取值越接近于1,表明回归平方和占总变差平方和的比重越大,回归直线与各观测点越接近,用X的变化来解释y的变差部分越多,回归直线的拟合程度就越好反之,d取值越接近于0,回归直线的拟合程度越差在多元线性回归分析中,模型中的解释变量越多,对y的变差的解释程度也就越高,式值也就越大但多一个解释变量在进行统计检验时就会减少一个自由度,也可能导致解释变量之间存在着高度的线性关系,导致参数估计的有效性降低常调整为多重判定系数,或召值的平方根,复相关系数[例题•单选题]用判定系数r2测定回归直线拟合程度,r2越接近于1拟合程度越好,这是因为oa.回归平方和占总变差平方和的比重越大b.回归平方和占总变差平方和的比重越小c.残差平方和占总变差平方和的比重越大d.残差平方和占总变差平方和的比重越小答案a
2.估计标准误差多元线性回归中的估计标准误差是对多元回归模型中的误差项e方差的一个估计值,其计算公式为式中的k为自变量的个数
二、回归方程的检验在一元线性回归分析时,由于只有一个解释变量,因此t检验与f检验的结果是等价的但在多元回归中,这两种检验不再等价线性回归方程的显著性检验主要是检验因变量同多个自变量的整体线性关系是否显著回归系数的检验则是对每个回归系数分别进行单独的检验,以判断每个自变量对因变量的影响是否显著
1.线性回归方程的显著性检验一f检验f检验是从回归效果检验回归方程的显著性如果是显著的,说明回归方程线性关系是存在的,如果不显著,说明回归方程的线性关系是不存在的检验的步骤首先,提出假设:hoP1=32—k=0hi8-B2…0k至少有一个不为0然后,计算检验统计量f,并得出对应的概率伴随概率值()[()]()f=ssr/k/sse/n-k-l~f k,n-k-l最后,根据概率进行判断如果概率(sig.值)小于我们事前确定的显著性水平时,拒绝原假设,认为备择假设3,B2…Bk至少有一个不为0的,回归方程的线性关系是存在的否则,不能拒绝原假设,即回归方程不存在线性关系
2.回归系数的显著性检验一t检验回归系数的显著性检验就是检验解释变量Xi对因变量y的影响是否显著首先,提出检验的假设h:8尸0,hiBiWO0如果h成立,则因变量y与解释变量Xi之间没有真正的线性关系,即Xi的变化对y没有显著的线性影响其次,计算检验统计量t,并得出对应的概率(伴随概率)值,A,检验统计量JvW月)(4v玳月)为回归系数的标准差)最后,根据概率进行判断如果概率(sig.值)小于我们事前确定的显著性水平a时,拒绝原假设,认为3W0,即自变量Xi对y的线性效果显著否则,不能拒绝原假设,认为自变量xi对y的线性效果不显著[例题•单选题]度量了因变量与k个自变量的总体相关程度的指标为()a.相关系数b.多重相关系数c.多重判定系数d.估计标准误差答案b解析在统计中,研究一个因变量与多个自变量之间相互关系的理论和方法,称为多元相关分析或复相关分析第六章时间序列分析重点:
1、增长量分析、发展水平及增长量
2、增长率分析、发展速度及增长速度
3、时间数列影响因素、长期趋势分析方法难点:
1、增长量与增长速度
2、长期趋势与季节变动分析第一节时间序列的分析指标知识点一时间序列的含义时间序列是指经济现象按时间顺序排列形成的序列这种数据称为时间序列数据时间序列分析就是根据这样的数列分析经济现象的发展规律,进而预测其未来水平时间数列是一种统计数列,它是将反映某一现象的统计指标在不同时间上的数值按时间先后顺序排列所形成的数列表现了现象在时间上的动态变化,故又称为动态数列一个完整的时间数列包含两个基本要素:一是被研究现象或指标所属的时间;另一个是该现象或指标在此时间坐标下的指标值同一时间数列中,通常要求各指标值的时间单位和时间间隔相等,如无法保证相等,在计算某些指标时就涉及到“权”的概念研究时间数列的意义了解与预测[例题•单选题]下列数列中哪一个属于时间数列().a.学生按学习成绩分组形成的数列b.一个月内每天某一固定时点记录的气温按度数高低排列形成的序列c.工业企业按产值高低形成的数列d.降水量按时间先后顺序排列形成的数列答案d解析时间序列是一种统计数列,它是将反映某一现象的统计指标在不同时间上的数值按时间先后顺序排列所形成的数列,表现了现象在时间上的动态变化知识点二增长量分析(水平分析)发展水平发展水平是指客观现象在一定时期内(或时点上)发展所达到的规模、水平,一般用y(t=l,t2,3,…,n)在绝对数时间数列中,发展水平就是绝对数;在相对数时间数列中,发展水平就是相对数或平均数几个概念期初水平y,期末水平”,期间水平(力,丫2,….ye);报告期水平(研究时期水平),基期水平(作为对比基础的水平)二.增长量增长量是报告期发展水平与基期发展水平之差,增长量的指标数值可正可负,它反映的是报告期相对基期增加或减少的绝对数量,用公式表示为增长量=报告期水平一基期水平根据基期的不同确定方法,增长量可分为逐期增长量和累计增长量L逐期增长量是报告期水平与前一期水平之差,用公式表示为△二y-y-i(i=l,2,•••,n)n n
2.累计增长量是报告期水平与某一固定时期水平(通常是时间序列最初水平)之差,用公式表示为△=y-y(i=l,2,•••,n)(i=l,2,•••,n)n0二者关系逐期增长量之和=累计增长量
3.平均增长量平均增长量是时间序列中的逐期增长量的序时平均数,它表明现象在一定时段内平均每期增加(减少)的数量一般用累计增长量除以增长的时期数目计算(y-y)/nn0[例题•单选题]某社会经济现象在一定时期内平均每期增长的绝对数量是()oa.逐期增长量b.累计增长量c.平均增长量d.增长速度答案c解析平均每期增长的绝对数量是平均增长量知识点三增长率分析(速度分析)一.发展速度发展速度是以相对数形式表示的两个不同时期发展水平的比值,表明报告期水平已发展到基期水平的几分之几或若干倍计算公式为发展速度=报告期水平/基期水平*100%由于基期选择的不同,发展速度有定基与环比之分
①定基发展速度定基发展速度是报告期水平与某一固定时期水平(通常是最初水平)的比值y/yn0它说明社会经济现象相对于某个基础水平,在一定时期内总的发展速度
②环比发展速度环比发展速度是报告期水平与其前一其水平的比值y/y-in n它说明所研究现象相邻两个时期(逐期)发展变化的程度定基发展速度与环比发展速度的关系有第一,定基发展速度等于相应时期内各环比发展速度的连乘积区斗…也=2九八%汽第二章数据描述重点
1.定性数据和定量数据的图表展示方法
2.标准的统计表的构成
3.定性数据和定量数据的数字特征难点
1.定性数据和定量数据的图表展示的区别
2.定性数据和定量数据的数字特征的区别知识点一定性数据的图表展示方法定性数据包括分类数据和顺序数据,它们的图表展示方法基本相同通常可以用频数分布表和图形来描述一.生成频数分布表定性数据本身是对事物的一种分类,因此,只要先把所有的类别都列出来,然后统计出每一类别的频数,就是一张频数分布表频数分布表中落在某一特定类别的数据个数称为频数频数分布包含了很多有用的信息,通过它可以观察不同类型数据的分布情况频数分步表一般是用excel生成[例题•单选题]在某一特定类别中的数据个数称为oa.均值b.众数c.标准差d.频数答案d解析频数分布表中落在某一特定类别的数据个数称为频数频数分布包含了很多有用的信息,通过它可以观察不同类型数据的分布情况第二,两个相邻时期定基发展速度的比率等于相应时期的环比发展速度;%匹二生4*-iy为实际工作中,经常利用上述关系式对发展速度指标进行推算或换算
③年距发展速度对于具有季节变化的一些社会经济现象,为了消除季节变动影响,可以计算年距发展速度它消除了季节变动的影响,表明本期水平相对于上年同期水平发展变化的方向与程度,是实际统计分析中经常应用的指标年距发展速度=本年月(季)发展水平/去年同月(同季)发展水平【例题・判断题】环比发展速度的连乘积等于相应的定基发展速度答案正确二.增长速度增长速度是报告期增长量与基期水平的比值,表明报告期水平比基期增长(或降低)了百分之几或若干倍计算公式增长速度;增长量/基期发展水平增长速度=发展速度-1由于基期选择不同,增长速度也有定基与环比之分
1.定基增长速度若增长量为累计增长量,则计算的定基增长速度,用%表示,有a;=(y-y)/y
02.环比增长速度若增长量为逐期增长量,则计算的环比增长速度,用匕表示,就有()bi=yi-yi-i/yi-i
三、平均发展速度和平均增长速度平均发展速度和平均增长速度是两个非常重要的平均速度指标平均发展速度反映现象在一定时期内逐期发展变化的一般程度;平均增长速度反映现象在一定时期内逐期增长(降低)变化的一般程度平均增长速度=平均发展速度一
13.年距发展速度对于具有季节变化的一些社会经济现象,为了消除季节变动影响,可以计算年距发展速度它消除了季节变动的影响,表明本期水平相对于上年同期水平发展变化的方向与程度,是实际统计分析中经常应用的指标年距发展速度=本年月(季)发展水平/去年同月(同季)发展水平[例题•单选题]某企业2008年参加医疗保险的人数是2004年的3倍,比2007年增长20%,那么,2007年参加医疗保险的人数比2004年增长()a.250%b.300%c.150%d.60%答案c解析2008年参加医疗保险的人数是口年的倍,即比年q200820043q2008=3q2004,rfd Q2OO8q2007增长20%,即(1+20%)9所以(1+20%)9贝
2.5增长率Q2008=q2007Q2007=3q2004Q2007=q004,2=250%-1=150%.[例题•单选题]已知各期环比增长速度为2%,5%和8%,则相应的定基增长速度的计算方法为()a.102%*105%*108%b.102%*105%*108%-1c.2%*5%*8%d.2%*5%*8%T答案b解析有一定时期内现象发展的总速度等于各期环比发展速度的连乘积求增长速度要先还原为发展速度后再减1得[例题•单选题]某企业的产品产量2000年比1995年增长了
35.1%,则该企业1996——2000年间产品产量的平均发展速度为()乳A.V
35.1%B,V
135.1%C.V
35.1%D.355%答案b解析发展速度等于增长速度+1,平均发展速度则是定基发展速度开n次根号[例题•单选题]某企业2009年产品产量比2000年增长了1倍,比2005年增长了
0.5倍,则2005年比2000年增长了()a.
0.33答案a解析a2009/a2000=200%,a2009/a2005=150%,则a2005/a2000-l=200%/150%-l=133%-l=33%[例题•单选题]国家统计局2012年2月22日公告,经初步核算,2011年我国的国内生产总值按可比价格计算比上年增长
9.2%这个指标反映的是()a.环比发展速度b.环比增长速度c.定基发展速度d.定基增长速度答案b第二节长期趋势分析知识点一时间数列影响因素的分解
一、时间数列的基本构成要素在进行时间数列分解时,一般把时间数列的构成因素按性质和作用分为四类即长期趋势、季节变动、循环波动和不规则变动长期趋势时间数列在长时期内呈现出来的某种持续上升或持续下降的变动称为长期趋势是对未来进行预测和推断的主要依据长期趋势往往是由某些固定的、系统性的因素造成的代表着研究对象的总发展方向,它既可以是线性的,也可以是曲线的季节波动时间数列在一年内重复出现的周期性波动称为季节波动季节波动中“季节”一词不仅仅是指一年中的四季,其实它是广义的指任何一种周期性的变化循环变动时间数列呈现出来的围绕长期趋势的一种波浪形或震荡式变动称为循环变动,也称作周期变动周期性变动没有固定规律,其循环的幅度和周期的波动性很强,而且其周期短的一般也要3-5年,长的可达几十年不规则变动由各种偶然的、突发的或不可预见的因素引起的,称为不规则变动或随机变动[例题•单选题]时间序列中在一年之内的周期性波动为()a.长期趋势b.季节变动c.循环变动d.不规则变动答案b解析时间数列在一年内重复出现的周期性波动称为季节波动季节波动中“季节”一词不仅仅是指一年中的四季,其实它是广义的指任何一种周期性的变化[例题•单选题]若要观察现象在某一段时期内变动的基本趋势,需测定现象的()a.季节变动b.循环变动c.长期趋势d.不规则变动答案c解析若要观察现象在某一段时期内变动的基本趋势,需测定现象的长期趋势知识点二时间数列的分解模型时间数列分析的一项主要内容就是把这几个影响因素从时间数列中有目的的分离出来,或者说对数据进行分解、清理,并将他们的关系用一定的数学关系式予以表达加法模型假定四种变动因素相互独立,时间数列各时期发展水平是各个构成因素的总和用数学表达为y=t+s+c+i乘法模型假定四种变动因素彼此间存在着交互作用,时间数列各时期发展水平是各个构成因素的乘积,其数学表达式y=t・s・c・it代表长期趋,s代表季节变动,c代表循环变动,i代表不规则变动需要说明加法模型中,各个因素都是绝对数,乘法模型中,除了长期趋势是绝对数外,其他因素都是以相对数或指数的形式出现的知识点三长期趋势分析方法
一、回归方程法回归方程法就是利用回归分析方法,将时间作为解释变量,建立现象随时间变化的趋势方程建立趋势性方程之前,首先要确定趋势的形态,最常用的方法是先画散点图若散点图属直线趋势形态,可拟合直线方程;若为曲线形态,则拟合曲线方程线性趋势是指现象随着时间的推移,时间数列的逐期增减量大致相等,从而呈现出稳定增长或下降的线性变化规律直线趋势方程模型J,=a+bt代表时间数列的趋势值,t代表时间标号,a代表趋势线在y轴上的截距,当t=0时,】•的数值;b为趋势线的斜率,即t每变动一个单位时间时,平均变动的数值用最小二乘法求得a、b的参数公式为:式中,n为时间数列的项数,公式中的数值都可求通常,为了简便,把时间数列的中点定为原点,使得,这样,a、b的求解公式可简化为回归方程法是利用回归分析方法,将时间作为解释变量t,建立现象随时间变化的趋势方程如=a+bt,利用最小二乘法对参数a,b进行估计,作出回归方程再对未来的某个时间t做趋势估计
(二)简单移动平均法通过对时间数列相邻各项求平均数作为趋势值或预测值的平滑或预测方法,称为移动平均法简单移动平均法是将最近的k期数据加以平均,作为移动中项的趋势测定值设移动时期项数为k,则第t期的移动平均值为注意当k取奇数或偶数的不同形式时,处理方法有区别对于k取奇数时,可直接运用公式即可;当k取偶数时,要在第一次对原数列作移动平均后,对所得新数列再做一次相邻两项的移动平均,这样才能完成中心化需要指出,采用移动平均法,移动后形成的派生数列的项数要比原时间数列的项数少,按奇数时期项数移动,首尾要各少(k-1)/2项数值,按偶数时期项数移动,首尾要各少(k/2)项数值因此,用移动平均法只便于求时间数列各期的趋势值和观察长期趋势,而不便直接根据派生数列进行预测
(三)指数平滑法是对时间序列由近及远采取具有逐步衰减性质的加权处理,是对移动平均法做的改进根据指数平滑次数的不同,指数平滑法有一次指数平滑、二次指数平滑等一次指数平滑()Si=a x+l-a stt使用指数平滑法时,关键的问题是要确定一个合适的平滑系数a(0a1)[例题•多选题]测定长期趋势的方法主要有()a.回归方程法b.移动平均法c.指数平滑法d.半数平均法e.时距扩大法答案abc[例题•单选题]我国2012年一季度的gdp比去年同期增长
8.1%计算这一年距增长速度指标是为了()a.消除长期趋势的影响b.消除循环变动的影响c.消除季节变动的影响d.消除不规则变动的影响答案c[例题•单选题]当时间序列的环比发展速度大体相同时,适宜拟合()a.抛物线b.指数曲线c.直线d.对数曲线答案b[例题•单选题]移动平均法是用来测定时间序列长期趋势的基本方法,在选择移动平均的项数时()a.应采用偶数b.应采用奇数c.应按照方便的原则确定d.应根据序列的自然周期确定答案d[例题・单选题]一次指数平滑系数a的取值越接近1,表明()a.近期数据的作用保持不变b.近期数据的作用越小c.近期数据的作用越大d.近期数据的作用迅速衰减答案C第三节季节变动分析知识点一季节变动季节变动即经济现象在一年内随季节的转变而呈现出周期性变动季节变动有三个特点:一是季节变动每年重复进行;二是季节变动按一定的周期进行;三是每个周期变化强度大体相同季节变动分析的其中两种方法一是不考虑长期趋势的季节指数法;另一是考虑长期趋势的回归方程法消除法知识点二季节变动分析方法
一、不考虑长期趋势的季节指数法季节指数法是一种通过计算各月(或季)的季节指数(又称季节比率),来反映季节变动的一种分析方法季节比率的计算方法首先计算出各年同期发展水平的序时平均数,然后将各年同期平均数与全时期总平均数对比即得到季节比率
一、不考虑长期趋势的季节指数法季节比率的具体步骤
1.计算各年相同季度的平均数
2.计算各年季节总平均数
3.求各季度季节比率季节比率:同季平均数/总平均数缺陷第一,没有考虑长期趋势的影响;第二,季节比率的高低受各年数值大小的影响
二、考虑长期趋势一一回归方程法消除法回归方程剔除法的步骤第一,利用最小二乘法,求出回归拟合值;第二,用观察值除以拟合值,剔除原时间数列中的长期趋势;第三,计算季节指数[例题•单选题]季节比率的高低受各年数值大小的影响数值大的年份对季节比率的影响()a.较大b.较小c.依不同情况而定d.无法判断答案a[例题-多选题]下列哪些是季节变动的特点()a.季节变动每年重复进行b.分析季节变动时无法消除长期趋势的影响c.季节变动按照一定的周期进行d.季节变动是没有规律、不可预测的e.季节变动的每个周期变化强度大体相同答案ace[例题•多选题]用季节指数法分析季节变动的缺陷是()a.没有考虑长期趋势的影响b.考虑了长期趋势的影响c.季节比率的高低受各年数值大小的影响d.季节比率的高低不受各年数值大小的影响e.无法消除长期趋势的影响答案ac[例题•单选题]网球中心销售额各季度的季节比率分别为80%、115%、135%和70%则该网球中心一季度销售额()oa.比全期水平高20%b.比全期水平低20%c.比全期平均水平高20%d.比全期平均水平低20%答案d第七章统计指数重点统计指数的概念及种类
1..综合指数拉氏指数与派氏指数
2.居民消费价格指数、股价指数3难点拉氏指数与派氏指数L第一节统计指数的概念和种类知识点一统计指数的概念指数是用于经济分析的一种特殊统计方法,它主要用于反映事物数量的相对变化程度广义地讲,任何两个数值对比形成的相对数都可以称为指数;狭义地讲,指数是用以测定总体各变量在不同场合下,综合变动的一种特殊相对数狭义所说的总体,其单位及标志值是不能直接加总的总体我们所讨论的统计指数是指狭义的指数[例题•单选题]从指数理论和方法上看,统计指数所研究的主要是()广义指数a.狭义指数b.广义指数和狭义指数C.拉氏指数和派氏指数d.答案解析我们所讨论的统计指数是指狭义的指数b二.定性数据的图形表示定性数据(分类数据和顺序数据)可以描绘出它们各类的比例,常用饼图和条形图表示
(一)饼图饼图又称圆饼图、圆形图等,它是利用圆形及圆内扇形面积来表示数值大小的图形饼图主要用于总体中各组成部分所占比重的研究
(二)条形图条形图是用宽度相同的条形的高度或长度来表述数据多少的图形,用于观察不同类别数据的多少或分布情况
(三)环形图饼图只能显示一个变量(如年龄变量)各部分所占的比重如果我们想比较不同变量之间的结构差异,就可以通过环形图来实现首先,利用产生频数表的方法先做出分性别的年龄分布表;然后,根据上表再绘制出环形图[例题-单选题]条形图是利用宽度相同的条形的()来表述数据多少的图形a.面积b.高度或长度c.频数d.类别答案b解析条形图是用宽度相同的条形的高度或长度来表述数据多少的图形,用于观察不同类别数据的多少或分布情况[例题-单选题]若需要比较不同变量之间的结构差异,可采用的图形为()a.频数分布图b.条形图c.饼图d.环形图答案d知识点二统计指数的种类.个体指数和总指数1按计入指数的项目的多少不同,将统计,髅分为个体指数和总才毁个例旨数是反映某一项目或变量变动的相对数;总指数是反映多种项目或变量综合变动的相对数个体指数就是指单一项目指数,其计算公式为Keq;/q代表物量个体指数攵p/p:代表价格个体指数综合指数表明多种要素构做象的综合财的相对数©-p°q°代表综合指数数量指标指数和质量指标指数
2.数量指数也称物量指数,是表明总体单位数量、规模等数量变动的相对数,如,产量指数、销量指数等质量指数是表明总体单位水平、工作质量等质量变动的相对数,如价格指数、单位成本指数、劳动生产率指数等[例题•单选题]统计指数按其反映的对象范围不同分为()简单指数和加权指数a.综合指数和平均指数b.个体指数和综合指数c.数量指数和质量指数d.答案C解析按计入指数的项目的多少不同,将统计指数分为个体指数和总指数[例题•单选题]下列指数中属于数量指数的是()产量指数a.价格指数b.单位成本指数C.劳动生产率指数d.解析数量指数也称物量指数,是表明总体单位数量、规模等数量变动的相对数,如,产量指数、销量指数等[例题•单选题]下列选项中属于质量指数的是()产量指数a.价格指数b.员工人数指数C.销售量指数d.答案b解析质量指数是表明总体单位水平、工作质量等质量变动的相对数,如价格指数、单位成本指数、劳动生产率指数等第二节综合指数知识点一综合指数综合指数是总指数的一种编制方法编制原理利用总量指标的综合性,将两个比较时期的总量指标加以对比,综合计量复杂现象综合的变动程度与方向其编制计算的特点是先综合,后对比;它编制的要点是将不能直接加总的研究对象,通过一定的方式形成可以加总、对比的总量指标后进行对比,计算总指数第三节几种常用的价格指数知识点一居民消费价格指数定义L居民消费价格指数英文缩写为是反映一定时期内城乡居民所购买的生活消费品价格和服务项cpi目价格变动趋势和程度的一种相对数通常作为观察通货膨胀水平的重要指标分类
2.居民消费价格指数可分为城市居民消费价格指数和农村居民消费价格指数,也可以编制全国居民消费价格指数消费者物价指数测量的是随着时间的变化,包括多种各式各样的商品和服务零售价格的平均变200化值这多种商品和服务被分为个主要的类别在计算消费者物价指数时,每一个类别都2008有一个能显示其重要性的权数这些权数是通过向成千上万的家庭和个人调查他们购买的产品和服务而确定的权数每两年修正一次,以使它们与人们改变了的偏好相符中国包括食品、烟酒、衣着、家庭设备、医疗卫生保健、文化教育娱乐、交通通讯、居住等cpi八大类第一类是食品,食品当中又包括粮食、淀粉、干豆类和豆制品、油脂、肉禽及其制品,蛋、水产品,菜、调味品、糖、茶和饮料等第二大类是烟酒及其用品;第三大类是衣着;第四大类是家庭设备用品和维修服务;第五大类医疗保健和个人用品;第六大类是交通和通讯;第七大类是娱乐、教育、文化用品和服务;第八大类是居住.作用3通过这一指数,可以观察消费价格的变动水平以及对消费者货币支出的影响,研究实际收入和实际消费水平的变动状况此外,还具有作用反映通货膨胀状况反映货币购买力变动反映对职工实际工资的影响[例题•多选题]居民消费价格指数能够反映()城乡商品零售价格的变动趋势a.城乡居民购买的生活消费品和服务项目价格的变动趋势b.通货膨胀状况C.货币购买力变动d.物价变动对职工实际工资的影响e.答案:bcde[例题•多选题]下面关于居民消费价格指数的说法中正确的有()该指数可反映通货膨胀状况a.该指数能反映货币购买力变动b.该指数可反映对职工实际工资的影响c.该指数是采用加权平均法计算的d.该指数大于说明报告期与基期相比综合物价水平下降e.100,答案abed解析该指数大于说明报告期与基期相比综合物价水平上升的100,知识点二知识点二£股票价格指数股票价格一般是指股票在证券市场上交易时的市场价格.股票价格是一个时点值.股价平均数是股票市场上多种股票在某一时点上的菖术平均值,一般以收盘价格来计苴.式中,pi为第£种股票的收盘价,n为样本股票数股票价格指数是反映某一股票市场上多种股票价格变动趋势的一种相对数,简称股价指数,其成位一般用点”(point)表示.即一般将基期指数作为100,每上升或下降一个单位林为,点”£外2式,得股价指数为:解:根据股价指数的计算方法一般以发行量为权数进行加权综合,其公式为A.=1式中为第1种股票的报告期价格,PW为第1种股票的基期价格,取为第1种股票的发行量,它可以确定为基期,也可以确定为报告期,但大多数股价指数是以报告期发行量为权数计算的.【例题】设有三种股票的价格和发行量资料如下表试计算股票价格指数:三种股票的价格和发行量资料股窠名称I报告期发行猫(万股)(ql)基期价格(°)本日收盘价(P】)1012500A15B2521100011500C1825二迦岫15x2RxlOO%硼21x1000+25x196000=12468%EWi10x2500+25x1000118x1500=TO00=即股价*殿上涨了
24.68%目前,世界各国常用的的股价指数有道•琼斯股票价格平均指数、标准普尔指数、恒生指数、上证股价指数、深圳股价指数等:,一[例题•判断题]道•琼斯股票价格平均指数采用加权算术平均法计算答案错误解析道氏指数采用不加权算术平均数计算用当日的当时的股票价格算术平均数与基期(1928年月日)的比值求得101[例题•判断题]计算股票价格指数时,权数一般取股票的发行量,且必须以全部股票为计算对象答案错误解析道•琼斯股票价格平均指数、标准普尔指数、恒生指数都不是以全部股票为计算对象,中国的上证股价指数和深圳股价指数是以该交易所全部股票为计算对象的解析饼图只能显示一个变量(如年龄变量)各部分所占的比重如果我们想比较不同变量之间的结构差异,就可以通过环形图来实现[例题・单选题]饼图是利用圆形及圆内扇形的()来表示数值大小a.面积b.弧线长度c.角度d.颜色答案a解析饼图又称圆饼图、圆形图等,它是利用圆形及圆内扇形面积来表示数值大小的图形饼图主要用于总体中各组成部分所占比重的研究第二节用图表展示定量数据知识点一生成频数分布表定性数据的图示表示方法,也都适用于定量数据但定量数据还有一些特定的图示方法,它们并不适用于定性数据生成定量数据的频数分布表时,首先是将数据进行分组,然后再统计出各组别的数据频数即可定量数据频数分布表的生成过程首先,要对数据进行分组其次,要确定组距所谓组距是指每个组变量值中的最大值与最小值之差每组最大值称为该组上限,最小值称为该组下限则组距等于上限与下限之差,即组距=上限-下限[例题•单选题]生成定量数据的频数分布表时,首先要对数据()a.分类b.确定组距c.分组d.确定组频数答案c解析生成定量数据的频数分布表时,首先是将数据进行分组,然后再统计出各组别的数据频数即可。
个人认证
优秀文档
获得点赞 0