还剩7页未读,继续阅读
文本内容:
32-30447数据、模型与决策复习考试资料第一章总论
1.模型的含义填空、名词解释★通俗地讲,模型是对客观事物的一种描述、模仿或抽氢
2.数据、模型、决策的关1数据与模型与同效劳于决策分析系单项选择★★2通过模型转化处理,不仅能对数据的价值结构进行改造,而且能对决策进行深层次的分析3数据与模型是投入与产出的关系4与理性决策对应的是行为决策,这种决策理论又称为以右脑直觉思维为主的决策这种决策带有直觉性、模糊性和突发性
3.开展决策分析需要考虑1以定性分析为先导;的要求单项选择、填2以治理决策为根本目标;空★★★3以科学方法论为指导;4以数据模型为主要依据;5以软件应用为辅助性手段
4.运用数量分析手段进行1明确对象,界定问题治理决策的过程单项选2建立决策分析模型择、简答★3搜集数据资料4模型求解和检验5结果解读利敏感性分析6形成决策分析汇报第二章数据资料的来源、分类与变换
5.普查的含义是特意组织的、一次性的全面调查,主要用来搜集基•时单项选择、名词解点或肯定时期内现象总量的资料释★★★
6.现代普查活动的特征1定期举行简答★★2依法进行3应用广泛4质量操纵5工程增多6计算机介入
7.随机抽样调查单项选按照随机性原则,从调查对象总体中抽取一局部单位择、名词解释★★组成样本,然后依据样本调查的结果,对总体情况进行推断
8.抽样调查的特征简1按照随机性原则确定观察单位答★★2依据局部单位的调查结果,对总体进行科学推断3抽样误差可以计算
9.简单随机抽样(单项从总体N个单位中抽取n个单位组成样本时,保证每选择、名词解释)★★★一个单位被抽出来的概率相等
10.双相抽样(单项选择、先从总体中随机抽取一个较大的样本,获得第一重样本,填空、)★★★目的是更好地搜集总体的辅助性资料和信息然后从第一重样本中随机抽取一个较小的样本即第二重样本,对研究目标进行统计推断
11.内容分析法的含义(单把非定量的文献史料、言语习惯等带有特征的因素设法项选择)★★★转换成可以量化处理的数据,对这些数据进行定量分析并做出相应的推断
12.参与观察法(单项选研究人员亲身参与到被研究人员的一般生活中,利用长择、名词解释)★★时间的相处,排除被研究人员的戒心以搞清所发生的事情及其真正原因
13.获得间接资料的渠道
(1)公司内部的历史记录(简答)★★
(2)政府部门
(3)国家统计局
(4)特意从事数据资料采集的组织
(5)各种各样的产业协会和一些特别利益组织
(6)网络媒介
14.定类资料的含义(单对事物进行分类或分组得到的结果,就是定类资料如汽项选择、填空)车的牌照、足球运发动运动衫上的号码、个人的社会保★★★险代码等,都属于定类资料
15.定序资料的含义语义上表现出明显的等级或顺序关系的定类资料,称为(单项选择、填空、名词定序资料解释)★★★
16.定距资料的含义(单具有定序资料的全部特征,并且任意两个数之间可以比项选择、填空、名拟差距大小的统计资料,就是定距资料词解释)★★
17.定比资料的含义(单具有定距资料全部的性质特征,并且有一个绝对零点的项选择、填空、名资料词解释)★★
18.截面资料的含义在圆二叱豆搜集起来的有关研究总体各个单位的资料(单项选择、填空、名词解释)★★
19.面板资料的含义截面资料和时间序列资料交错在一起,构成面板资(单项选择、填空)★★料
20.统计数据质量误差产
(1)调查打算工^丕充分引起的误差生的原因(单项选择、简
(2)数据搜集阶段发生的误差答)★★
(3)资料整理过程中产生的误差
21.后验技术(单项选择、在调查工作已经完成,进入数据编辑和整理阶段所用的填空、)★★★评估数据质量的方法
22.数据质量检查的抽样在一次调查之后,紧接着再从这些被调查单位中抽取肯方法(单项选择、填定数量的单位组成样本,重新调查聋记,最后空★★将两者的结果进行比照,以检查先前调查数据的质量,并进行适当的调整
23.运用后验技术检查数据1使用范围有限,对调查特征变化无常的活动,因找质量要注意的问题不出合理的假设而不能使用1简答★★2仅适用于对最后调查结果的检查,不能用于单项数据误差的评估,对改良数据搜集方法没有多大的指导作用3一般要求拥有同一研究主题的大量统计资料,没有系统的资料累积,后验技术难以派上用场4作为比照、推算根底的资料必须精确,否则无法了解调查数据的误差5其结果只反映数据的质量,不能提供新的统计数据
24.线性变换的含义线性变换是针对既定的线性关系所做的变换处理,一般单项选择、填空★★只涉及原点的改变和形状的压缩与放大,不会从根本上改变变换后数据与变换前数据之间的线性关系第三章统计资料描述分析
25.依据表中资料的时空U空间截面统计表特性,分为同一时间维度下进行观察或调查得到的统计资料叫做空单项选择、填空★间截面资料,由空间截面资料编制的统计表叫做空间截面统计表2时间序列表将某一现象随着时间变化产生的结果按照时间顺序编制在一起,就得到了时间序列表3混合截面表把几个不同时间维度下的空间截面资料编织在一张表中便得到混合截面表,不同时间下的样本观察单位可能不完全相同4面板数据表由一系列样本单位的时间序列资料编制而成,对每个样本单位都进行了动态跟踪观察
26.频数分布单项选择、频数分布是统计资料整理和描述分析过程中经常使用的填空、名词解释★★★一种方法,能对观察资料实施大幅度的压缩和提炼,使资料以更加清楚、简洁的形式展现出来,从而便于人们直接地了解现象的内部结构频数分布是在统计分组的根底上形成的样本单位在各个组间的分配
27.频率单项选择、填空★★频率是各个组中的频数与全部组的频数之和的比茎
28.累积频数单项选择、几个相关组发生频数的合计,能够反映组合合并后的观名词解释★★察值总共出现的次数
29.累积频率(填空、名词几个相关组发生频率的累加和,用于描述和解释组合并解释)★★后观察值出现的相对一再程度
30.饼形图与圆环图(单项
(1)饼状图选择〕★★又叫圆形图、扇形图,主要用于反映现象的内部构成情况,首先画一个圆,然后依据每个组或类别发生的频率,将圆形分割成一个个扇形,以扇形面积的大小代表组或类别出现的频率⑵圆环图以饼形图为根底,挖去圆形中心局部所得到的一种统计图形
31.帕累托图(单项选又称主次因素排列图,通过帕累托图,可以发觉或推断少择)★★数关键性属性变量值针对质量问题产生的原因,依据将各质量因素按影响大小排列绘制而成的帕累托图,可以发觉影响产品质量的少数关键性变量
32.雷达图(单项选择、名又叫蛛网图,能同时显示时间和空间的变化情况,在对面词解释)★★板数据进行图像描述时,雷达图是首选能同时完成横向比拟和纵向分析
33.茎叶图(填空、名词解释、计算题)★★★把每个观察数据划分成两个局部一一主部和余部,分别用植物的“茎〃和“叶〃形象地称呼,然后把数据的主部按从小到大的顺序纵向排列,再在每个数据的主部后面列出余部,由此得到的统计图称为茎叶图
34.算术平均数(填空、计将样本观察值累加起来除以观察数目.假定算题)★★与,工2,…,马为样本观察值,用土表示算术平均数,则算术平均数的根本计算公式为V-打+4+…+如_1n丫V
35.中位数(单项选择、名把观察值按从小到大的顺序排列,位置居中的数叫词解释)★★★做中位数名为一组观察值,按从小到大的顺序排列,结果用工
(1),%
(2),…,工
(71),其中工⑴为最小的观察值,工⑺为最大的观察值,其余类推,则中位数Me确实定方法为(x(n+l),n为奇数Me=(i「CM+、(+)]n为偶数中位数是一种较为常用的反映集中趋势的特征数空,具有如下特征不受极端值的影响,具有很强的抗T扰性由组距频数分布资料计算中位数时,要求是等距分组,且要求观察值作中位数所在的组中近似服从对称分布,否则计算结果可能存在误差
36.四分位数将一组观察资料按升序排列,然后把它等分成四段,位于第一个分界点处的值叫下四分位数,位于(单项选择)★★★第二个分界点的值叫上四分位数下四分位数的意义在于,能告诉我们该值比迪的观察结果大,但比遢的观察结果小上四分位数说明该值比75%的观察结果大,只比25%的观察结果小参考这些分界点,可以更清楚地对某项观察进行定位
37.截尾均值去掉观察值中的局部最大值和最小值,由保存下来的数(单项选择)★据计算的平均数,称为截尾均值截尾均值是一种常用的反映集中趋势的特征数字
38.算术平均数、中位数、算术平均数X,中位数Me,众数Mo众数的结合应用(单项选择、填空)★当又=Me=Mo,说明现象存在的状态是对醒的★当斤〉MeMo,说明现象呈右偏态,频数分布曲线的尾巴拖向右边当斤V MeVMo,说明现象呈左偏态,频数分存曲线的尾巴拖向左边
39.众数(单项选择、填众数依据观察值出现频数的大小来确定,观察值中出现次数最多的数值就是众数空、)★★★由组距频数分布确定众数时,采纳以下估量公式M=+八:4X%或M=UM卜:Ax%式中,M表示众数;加,分别表示众数组的下限和上限;d-为众数组的组距;A为众数组频数与紧邻较小观察值组频数的差;△,为众数组频数与紧邻较大观察值组频数的差
40.马尔可夫不等式(单项设工1,%2,…,小,为一组非负观察值,土为算术平均选择、填空)★数,K为大卜1的常系数,则有P(Xkx)^K★
41.离散趋势的含义观察值之间的差异程度或频数分布的分散程度称为离散(单项选择、名词解趋势释)★★★
42.极差的含义极差又叫全鹿,是观察资料中最大值与最小值之间的离(单项选择、填空)★★差
43.方差与标准差、变异
1.方差系数(单项选择、填空、观察值与它们的算术平均数离差平方和的算术平均名词解释、计算题)★★★数,称为方差方差的计算公式为l/ar(x)=S2=2仁1(左一x)
22.标准差对方差开平方,便得到标准差标准差的计算公式为S=乃2方差和标准差的数值大,说明离散程度大,反之说明离散程度小
3.变异系数变异系数是把算术平均数与标准差联系起来的•个测度变异系数CS的计算公式为C=^x100%s
44.相关性测量相关系数是反映变量间线性相关关系的重要指标依据(单项选择、计算题)★★总体资料计算的相关系数称为总体相关系数,用p表示,由样本资料计算的相关系数称为样本相关系数,用r表示设(%i,yi),(x,丫2),・一,(/1,%)为的定距(比)2尺度的样本观察资料,%,歹为样本均值,则相关系数的计算公式为_――阳一(y「讨rJ摩式阳-/2卜%(%-歹)2假设一Q,说明变量间存在负线性相关关系;假设4Q,说明变量间存在正线性相关关系相关系数r的值在-1与1之间,即有|丁|41|川值的大小,可以反映线性相关关系的强弱强度6值越大,说明相关程度越高Irl值越小,说明相关程度越低|r|=l,说明现象之间存在完全线性相关关系r=0说明现象之间完全不存在线性相关关系
45.燧的根本思想(单项由于均匀分布的埴最大,离散程度也最大,因此埴的计算选择、填空)★结果越大,意味着频数分布的离散程度也越大★第四章参数样本推断
46.参数与统计量
1.总体特征数字(单项选择、填空)★总体特征数字是依据研究对象全体调查资料计算★的,反映的是研究对象总体的根本信息,常称为参数
2.样本特征数字样本特征数字是依据研究对象中抽取出来的局部代表性单位即样本观察数据计算的,反映的是样本资粒的根本信息,也称为统计量
3.重复抽样和不重复抽样重复抽样和不重复抽样一样,其样本均值的分布与总体分布不同,但样本均值的均值与总体均值相回,样本均值的方差比总体方差小,不过,不重复抽样样本均值的方差比重复抽样样本均值的方差±
047.f分布(单项选择、填设相互独立,且皆服从标准正态分布空)★★N(0,1),令f=X+X9+…+x£称产服从自由度为九的f分布,记作产~产
(九)
(1)假设Xi〜*2(几]),乂2〜22(九2),且相互独立,则有XJX2〜22(%+%)该性质称为八分布的可加性12)一分布曲线随自由度上的增大而逐渐趋向于正态分笳曲线
(3)乂,为…,冲相互独立,且服从标准正态分布,令Qi+Q2+・・・+Q〃=SUXj2,Qi=(i=1,2,-,k)是秩为力的非负定二次型,则Qi,Q2,…,Qk相互独立,且分别服从自由度为七的炉分布的充要条彳牛是几1+/2+…+A=几
48.t分布(单项选择、填设x〜N(O,1),丫〜/(
①,且x与丫相互独立,则空)★★t=备^,服从自由度为九的t分布,记作t〜七
(九)总体是正态分布,总体参数方差未知,且样本容量比拟小,这种情况下对总体均值的统计估量和假设检验,需要利用£分布
49.F分布[单项选择、填设X〜/2
(九),y/2(m),且相互独立,则称空)★★F=等^服从自由度为(几,m)的F分布,记作Y/mzF F(n,〜F分布的应用十分广泛,可用来检验两正态总体方差是否相等,也可以用来检验回归方程是否有代表性,是方差分析和多元统计中重要的检验手段
50.重复抽样(单项选择、重复抽样是指,从总体N个单位中抽取n个单位组成样名词解释)★★本时,每次只从总体中抽取一个单位,登记后直把它放回到原来的总体中去,让这个被抽出来的单位还彳了时机参加下一次抽选这种抽样方法的特点是,每•次抽取样本单位时总体单位数都不变,每个样本单位都是从N个单位中抽取出来的,同一个单位有屡次时机被抽到
51.不重复抽样(单项选不重复抽样是花,从总体N个单位中抽取n个单位组成择、名词解释)★★样本时,每次从总体中抽取一个单位,但凡被抽中的单位不再放回到原来的总体中,接卜来抽选样本单位,只是从剩下的总体单位中抽取,它的特点是,相当于一次性从总体中抽出n个单位,样本中不存在相同的单位
52.区间估量(单项选择、区间估员用两个估量量值构成的区间作为对总体参数取填空题)★★值范围的估量假定员,德分别是参数e的两个性质相同的估量量,如果用(员,)估量这就是区间估量
53.置信区间与置信水平样本推断中,一般把统计估量与概率保证程度及估量精(单项选择、填空题)度联系起来的区间称为置信区间★★如果Xi,X2,…,Xn,为f(x;)的一个简单随机样本,是总体参数,由样本确定的估量量为=9*(X1,X,…,X)和@2=2(*1,乂2,…,X),n n对于给定的a(0a1),能使P®00)=1一对任意20成立,则称为6的置信区回其中,称为置信区间的工S,灰称为置信区间的上限,1-Q称为置信度或置信水平
54.总体比例区间估量(填
1.单总体比例区间估量空题、计算题)设Xi,X2,…,X”是来自0-1总体X的简单随机样本,总体★★★比例为“总体方差为pQ-p),样本比例为白,样本方差为力(1一0,1-仇为直信水平当样本容量几比拟大时,样本比例方服从正态分布,这样便有•A”P(l-P)、p〜N(p,九)于是有迎(力一P)而丁◎)仿照总体均值区间估量的做法,在置信水平上工下,总体比例2的估量区间为ZA7IP(I-P)IP(1-P\(P~zl-a/2^—^—P+Z-a/2y式中,Z-〃1表示标准正态分布的分位数值
2.两总体比例差区间估量设为,丫2,…,乂八是来自0-1总体X的简单随机样本,总体比例为加总体方差为“1-Px),YY….,L为来自另lf2一0-1总体y的简单随机样本,总体比例为py,总体方差为P“l-Py),且两样本相互独立1-a为置信水平,确定管丫--的区间估量当样本观察的规模比拟大时,以下结论同样成(PX-M-^X-VY}____________侬(1-Px)|Py(l一火)y]n m由此可得PX-Py的区间估量__________((次-3-小仁片用+年也,物-%)+3胖泮+咤沿)
55.两总体方差比检验设X1,X),…,X”是来自正态总体NSY,成)的一个简(计算题)★★单随机样本,,匕,力…匕,是来自总体NQ一凉)的一个样本,且相互独立,〃x,〃丫未知,Sg,S1分别是样本方差检验假设问题布二加对于假设H0:cy^—(JyH,:H检验统计量F=等〜尸(九一1,-1)mSY检验的拒绝域为C={尸a/2(兀-1租—1)UF—a/2(九一1,m-l)j。
个人认证
优秀文档
获得点赞 0