还剩18页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
实习一1总体根据研究目的所确定的同质观察单位的全体2样本从总体中随机抽取的部分个体3参数总体的统计指标或特征值4统计量由样本所算出的统计指标或特征值5概率在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数P就称为事件A出现的概率,记作P(A)或P6频率在n次随机试验中,事件A发生了m次,则比值f=m/n=A发生的试验次数/试验的总次数称为A在n次试验中出现的频率7变异同质事物间的差别8指标说明总体综合数量特征和数量关系的数字资料简答与思考题1什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学是应用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科统计学是研究数据的收集、整理、分析与推断的科学卫生统计学是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科生物统计学是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计、取样、分析、资料整理与推论的科学2医学统计资料主要来源于哪些方面?有何要求?医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等实验数据是指在试验过程中活的数据;现场调查资料主要来源于大规模的流行病调查获取的资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等这些资料的收集过程中,必须进行治疗控制,包括它的统一性、确切性、可重复性这些原始数据的精度和偏差应用明确的范围等)存在明显不同,而且影响到了总率的结果,这时就不宜再直接比较总率,而应考虑采用标准化法标准化法的基本思想,就是采用统一的标准(统一的内部构成)计算出消除内部构成不同影响后的标准化率(调整率),然后再进行比较3两组计数资料比较可否用z检验?如可以,有何适用条件?如果总体为正态而方差又已知,使用Z检验就可以了;如果总体并非正态而总体方差也是未知的,在样本容量大于30时,可以用Z检验如果总体非正态而样本容量又小于30,既不能用Z检验也不能用t检验,需要使用非参数检验4卡方检验的适用范围和各个公式的适用条件是什么?卡方检验用于推断两个及两个以上总体率或构成比是否有差别,两个分类变量间有无相关关系,多个率的趋势检验,以及两个率的等效检验等止匕外,也用于频数分布的拟合优度检验对不同的设计类型的资料,检验的应用条件不同
(1)完全随机设计两样本率的比较1)当n40,且T25时,用非连续性校正值;若所得P^ci,则改用四格表的确切概率法2)当n》40,且有1WTV5时,用连续性校正值3)n40,或有T1时,不能用检验,应当用四格表的确切概率法
(2)配对设计四格表1)当b+cN40,2)当b+c40,需作连续性校正,
(3)行列表资料1)不宜有1/5以上格子的理论频数小于5,或有1个格子的理论频数小于1;2)单向有序行列表,在比较各处理组的效应有无差别时,应该用秩和检验或Ridit检验;3)多个样本率(或构成比)比较的检验时,结论为拒绝无效假设时,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们彼此之间都有差别,或某两者间有差别若想进一步了解哪两者的差别有统计学意义,可用分割法5率的标准误的意义和用途?意义由于抽样的原因所造成的样本率与总体率的不一致就是率的抽样误差率的抽样误差的大小是用率的标准误来表示用途
①表示抽样误差的大小,说明样本率的代表性、可靠性
②对总体率的可信区间进行估计6以样本总体率估计的条件与z检验的适用条件有联系吗?Z检验的步骤适用条件
(1)已知一个总体均数;
(2)可得到一个样本均数及该样本标准误;
(3)样本来自正态或近似正态总体样本含量〃足够大,np与n(l—p)均三5,此时,样本率夕也是以总体率为中心呈正态分布或近似正态分布的实习六1简述非参数统计方法的概念及适用范围概念样本所来自的总体分布难以用某种函数式来表达,还有一些资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,解决这类问题的一种不依赖总体分布的具体形式的统计方法由于这类方法不受总体参数的限制,故称非参数统计法,或称为不拘分布的统计分析方法,又称为无分布型式假定的统计分析方法它检验的是分布,而不是参数非参数统计不需对总体分布(总体参数)作出特殊假设适用范围
(1)等级资料
(2)偏态分布资料当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未达到正态或近似正态分布时,宜用非参数检验
(3)各组离散程度相差悬殊,即方差明显不齐,且不能变换达到齐性
(4)个别数据偏离过大,或资料为单侧或双侧没有上限或下限值
(5)分布类型不明
(6)初步分析有些医学资料由于统计工作量大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)
(7)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法2非参数统计方法有何优缺点优点」
①非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛
②多数非参数统计方法要求的运算比较简单,可以迅速完成计算取得结果,因而比较节约时间
③大多数非参数统计方法在直观上比较容易理解,不需要太多的数学基础知识和统计学知识
④大多数非参数统计方法可用来分析如象由等级构成的数据资料,而对计量水准较低的数据资料,参数统计方法却不适用
⑤当推论多达3个以上时,非参数统计方法尤具优越性缺点
①由于方法简单,用的计量水准较低,因此,如果能与参数统计方法同时使用时,就不如参数统计方法敏感若为追求简单而使用非参数统计方法,其检验功效就要差些这就是说,在给定的显著性水平下进行检验时,非参数统计方法与参数统计方法相比,第n类错误的概率要大些
②对B于大样本,如不采用适当的近似,计算可能变得十分复杂注意凡符合或经过变换后符合参数检验条件的资料,最好用参数检验当资料不具备参数检验的条件时,非参数检验是一种有效的分析方法3对同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何为准两者各有使用条件,究竟取哪种结论,要根据资料是否满足该种检验方法的应用条件进行选择在符合参数检验的条件时,可接受参数检验的结论,而资料不符合参数检验的条件时,应以非参数检验的结论为佳如总体分布为极度偏态或其他非正态分布,或者两总体方差不齐时,此时宜采用秩和检验的结果4配对比较的假设检验,符合参数检验条件,能否出现t检验结果P
0.05,而非参数检验结果P
0.05如果出现上述情况,此时应怎样解释检验结果能实习七1相关与回归的区别与联系区别意义相关反映两变量的相互关系,即在两个变量中,任何一个的变化都会引起另一个的变化,是一种双向变化的关系回归是反映两个变量的依存关系,一个变量的改变会引起另一个变量的变化,是一种单向的关系应用研究两个变量的相互关系用相关分析研究两个变量的依存关系用回归分析研究性质相关是对两个变量之间的关系进行描述,看两个变量是否有关,关系是否密切,关系的性质是什么,是正相关还是负相关回归是对两个变量做定量描述,研究两个变量的数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果相关系数r与回归系数br与b的绝对值反映的意义不同r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高b的绝对值越大,回归直线越陡,说明当X变化一个单位时,Y的平均变化就越大反之也是一样联系r与b值可相互换算;r与b正负号一致;r与b的假设检验等价;回归可解释相关相关系数的平方一(又称决定系数)是回归平方和与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分2直线相关与等级相关有何区别区别
(1)资料要求不同直线相关要求X、y是来自双变量正态总体的随机变量;秩相关适用于不服从双变量正态分布或总体分布类型未知以及用等级表示的原始数据
(2)相关意义不同直线相关表示两变量的直线相关关系存在,秩相关表示两变量的相关关系联系:相关系数的取值范围相同;秩相关将原始数据进行秩变换,以秩次计算直线相关系数实习八1统计表、图的表达资料中有何特殊作用统计工作中,用统计表和统计图的形式说明资料在数量方面的大小、变动趋势、分布情况以及相互关系,以代替冗长的文字叙述,使结果一目了然,便于阅读,便于分析和比较2绘制统计表及统计图的原则和要求是什么统计表
(1)统计表的制表原则1)应重点突出,即一张表一般只包括一个中心内容,内容较多时可以用多个表格表达不同指标和内容2)统计表要层次清楚,即标目的安排及分组符合逻辑,便于分析比较主谓分明,通常主语放在表的左边,作为横标目;谓语放在右边,作为纵标目由左向右读,构成完整的一句话但若统计表的主语项目少而谓语项目多或主语项目多而谓语只有一项,亦可将纵标目作主语、横标目作谓语,阅读时从上至下3)统计表应简单明了,一切文字、数字和线条都应尽量从简
(2)制表要求统计表通常由标题、标目、线条、数字4部分组成表中数字区不插入文字,也不列备注项必须说明者标“中’号等,在表下方说明1)标题应高度概括表的主要内容,一般包括研究的时间、地点和研究内容,左侧加表号,置于表的上方2)标目有横标目和纵标目,分别说明表格每行和每列数字的意义横标目位于表头的左侧,代表研究的对象;纵标目位于表头右侧,表达研究对象的指标注意标明指标的单位3)线条力求简洁,多采用三条线,即顶线、底线、纵标目下横线部分表格可再用短横线将“合计”分隔开,或用短横线将两重纵标目分割开其它竖线和斜线一概省去4)数字用阿拉伯数字表示同一指标小数点位数一致,位次对齐表内不留空项,无数字用“一”表示,缺失数字用表示,数值为0者记为“0”统计图
①根据资料性质和分析目的正确选用适当的统计图
②除圆图外,一般用直角坐标系的第一象限的位置表示图域(制图空间),或者用长方形的框架表示
③绘制图形应注意准确、美观,给人以清晰的印象3常见的统计图有哪几种?它们的适用条件各是什么常用的统计图有直条图、直方图、百分比条图和圆图、线图、散点图、统计地图、箱式图等直条图适用于比较、分析独立的或离散变量的多个组或多个类别的统计指标指标既可以是绝对数,也可以是相对数直方图主要应用于频数分布资料r描述连续变量的频数分布百分比条图和圆图表示事物内部各构成部分所占的比重,适合描述分类变量的各类别所占的构成比其中,百分比条图特别适合作多个构成比的比较线图适合于描述某统计量随另一连续性数值变量的变化而变化的趋势,常用于描述统计量随时间变化而变化的趋势普通线图描述的是绝对变化趋势,半对数线图描述的是相对变化趋势,特别适宜作不同指标或相同指标不同组别的变化速度的比较散点图以直角坐标上点的密集程度和趋势来表示两个变量间的相关关系统计地图以不同的颜色和花纹表示统计量的值在地理分布上的变化,适宜描述研究指标的地理分布箱式图通过使用5个统计量(数据分布的中心位置、分布、偏度、变异范围和异常值)来反映原始数据的分布特征特别适合多组数据分布的比较4普通历史线图与半对数线图的统计分析应用上有何区别和联系从形式上看,二者的不同点在于纵坐标的尺度不同,普通线图的纵坐标为算术尺度,而半对数线图的纵坐标为对数尺度从用途上看,普通线图描述的是统计量的绝对变化趋势,半对数线图描述的是相对变化趋势,特别适宜作不同指标或相同指标不同组别的变化速度的比较实习九1试比较配伍设计与完全随机设计在设计方案和检验效能方面有何异同完全随机设计此种设计的优点是设计和统计分析比较简单缺点是试验效率较低,且只能分析一个因素两处理组
1.大样本(当nl及n2均大于50时)当资料为计量时可用u检验,当资料为计数时可用x2检验
2.小样本计量资料当服从正态分布且方差齐时,采用t检验;当服从正态分布但方差不齐时,采用/检验,当不服从正态分布或分布未知时,采用秩和检验;当资料为计数时可用确切概率法多个处理组为计量资料时当服从正态分布且方差齐时,采用方差分析;当不服从正态分布或分布未知时,采用秩和检验当资料为计数时采用x2检验配伍设计配对设计的优点比较理想地控制了非处理因素的影响,均衡性较好,减少抽样误差缺点:观察对象要经过挑选,特别是临床试验中病例较少时,样本含量较少当服从正态分布时,用配对比较的t检验;当不服从正态分布或分布未知时,用配对符号秩和检验2何谓调查研究和实验研究?各自的特点是什么调查研究是指研究者通过客观地观察、描述调查对象来搜集资料,未加任何的干预措施实验研究是指研究者根据研究假设主动地对研究对象加以干预措施,并观察总结其结果,回答研究假设所提出的问题3四种基本抽样方法的概念、优缺点和应用条件是什么1单纯随机抽样:是在总体中以完全随机的方法抽取一部分观察单位组成样本,其整个抽样过程,都体现了随机化的原则单纯随机抽样的优点简单直观,是最基本的概率抽样方法,也是其他概率抽样方法的基础单纯随机抽样的缺点当总体例数较多时,编号麻烦,实际工作中难以实施;样本分散,组织困难单纯随机抽样方法多用于总体例数较少的情况2系统抽样:是将总体的观察单位,按一定顺序号平均分成n个部分,每一部分抽取第k号观察单位组成样本,这里的k是随机确定的,其体现了系统抽样中的随机性系统抽样的优点是1易于理解,简便易行;2容易得到一个按比例分配的样本;3一般情况下样本的观察单位在总体中分布均匀,其抽样误差小于单纯随机抽样系统抽样的缺点是如果总体中观察单位按顺序有周期趋势或单调递增减趋势时,采用系统抽样可能产生明显的系统误差系统抽样方法多用于观察单位具有现成且与试验无关的自然编号,同时观察单位在总体中分布均匀3整群抽样:是先将总体按照某种与主要研究指标无关的特征划分为K个“群”,每个群包含若干观察单位,然后再随机抽取k个“群”,由抽取的各个群的全部观察单位组成样本其随机性主要体现在“群”的抽取过程整群抽样的优点是便于组织调查、易于质量控制和节省调查成本整群抽样的缺点是当样本含量一定时,因为样本观察单位并非广泛散布于总体中,整群抽样的抽样误差一般大于单纯随机抽样整群抽样较为常用,尤其当“群”间的个体变异较小时
(4)分层抽样:是先按对主要研究指标影响较大的某种特征,将总体分为若干类别(统计上称之为“层”),再从每一层内随机抽取一定数量的观察单位,合起来组成样本其随机性体现在层内的抽样过程分层抽样的优点是1)由于分层后增加了层内的同质性,观察指标变异减小,各层的抽样误差减小2)分层抽样便于对不同层采用不同的抽样方法3)分层抽样便于对各层独立进行分析分层抽样的缺点是层间变异较大,抽样误差较小;如果分层特征选择不当,层内变异较大,层间变异较小,抽样误差仍然较大,分层抽样就失去了意义一般情况下,当样本含量一定,几种方法抽样误差大小的排序为分层抽样w系统抽样w单纯随机抽样W整群抽样4何谓实验效应,对实验效应指标的要求是什么实验效应指处理作用于实验对象的反应,一般是通过某些观察指标,定量或定性地反映实验效应选择观察指标的基本原则指标的选择必须与研究目的密切关联客观性尽可能选择客观指标,避免一些笼统的、不确切的指标准确性选用的指标应尽量精确灵敏性和特异性实验效应指标应当同时兼顾其灵敏性和特异性,尽量使灵敏性和特异性都高5实验研究中为什么设立对照,常见的对照有几种,各自有何特点设立对照组的目的是衬托处理因素的效应对照原则所设立的对照组必须与实验组达到均衡可比除干预措施外,组间其他影响结果的非处理因素等尽可能相同对所研究疾病的易感度及发病机会相等检测和观察方法及诊断标准必须一致自身对照对照与实验在同一受试者身上进行,如用药前后作为对比空白对照对照组不施加任何处理因素安慰剂对照主要目的是为了平衡对照组病人心理因素的影响实验对照(阳性对照)对照组不施加处理因素,但施加某种实验因素标准对照不设立专门的对照组,而是用现有标准值或正常值做对照历史对照6实验设计为什么要遵循重复原则,影响重复性的因素有哪些重复原则包含重现性和观察单位数量两方面的含义可靠的实验结果应能在相同的条件下重现;可靠的实验结论也不能凭一次实验或3~5例结果获得,一定要有足够量的观察单位数7常用的实验设计方法有哪几种,各自的优缺点,适用条件及可采用的相应统计方法是什么完全随机设计此种设计的优点是设计和统计分析比较简单缺点是试验效率较低,且只能分析一个因素两处理组
1.大样本(当nl及n2均大于50时)当资料为计量时可用u检验,当资料为计数时可用x2检验
2.小样本计量资料•当服从正态分布且方差齐时,采用t检验;当服从正态分布但方差不齐时,采用t检验,当不服从正态分布或分布未知时,采用秩和检验;当资料为计数时可用确切概率法多个处理组为计量资料时当服从正态分布且方差齐时,采用方差分析;当不服从正态分布或分布未知时,采用秩和检验当资料为计数时采用x2检验配对设计配对设计的优点比较理想地控制了非处理因素的影响,均衡性较好,减少抽样误差缺点:观察对象要经过挑选,特别是临床试验中病例较少时,样本含量较少当服从正态分布时,用配对比较的t检验;当不服从正态分布或分布未知时,用配对符号秩和检验随机区组设计各个处理组中的受试对象不仅数量相同,而且比较均衡这种试验设计,既减小了抽样误差,还可以分析出处理组及配伍组两个因素的影响其缺点和配对设计相同,受试对象要经过挑选交叉设计交叉设计的优点是节省样本数,且均衡性较好但要求两种观察时间不能过长,处理没有持久效果,使两种处理能够很快区分开析因设计析因设计是多因素的交叉分组设计,即各个因素的所有水平相互组合在一起,形成多个交叉分组交叉组组数是各因素水平数的乘积析因设计不仅可以对每个因数各水平间进行比较,还可以分析因素间的交互作用序贯试验医学科研设计一般都是预先确定样本含量,结果分析在全部试验完成后作出序贯实验预先不需要确定试验例数事先根据实验标准绘好序贯实验图将每次试验结果的数据点到图上,当达到要求的检验界限,便可停止试验,作出判断3当今医学研究的趋势和特点如何?医学统计方法主要有哪些?医学统计学在本世纪二十年代以后才逐渐形成为一门学科解放前,我国学者即致力于把统计方法应用到医学中去,但人力有限、范围较窄解放后,随着医学科研工作的发展,本学科得到迅速普及与提高,通过大量实践,在不少方面积累了自己的经验,丰富了医学统计学的内容,而电子计算机的作用,更促进了多变量分析等统计方法在医学研究中的应用4医学统计资料的类型有哪些?
(1)计量资料对每个观察单位用定量的方法测定某项指标量的大小,所得资料称为计量资料计量资料也称定量资料、测量资料,其变量值是定量的,表现为数值大小,一般有质量衡单位如某一患者的身高(cm)、体重(kg)脉搏(次/分)等
(2)计数资料将观察单位按某种属性或类别分组,所得的观察单位称为计数资料计数资料也称定性资料或分类资料其观察值是定性的,表现为互不相容的类别或属性,如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数
(3)等级资料将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料等级资料又称为有序变量如患者的治疗结果可分为治愈、好转、有效、死亡5误差、系统误差、随机测量误差、抽样误差有何区别?对误差的控制各有何要求?如何控制?误差一个量的观测值或计算值与其真值之差,即一个量在测量、计算或观察过程中由于某些错误或通常由于某些不可控制的因素的影响而造成的变化偏离标准值或规定值的数量,误差是不可避免的系统误差在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差,要尽量查明原因,必须克服随机测量误差在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致譬如,实验操作技术不稳定,不同实验操作员之间的操作差异,电压不稳定及环境温度差异等因素造成测量结果的误差,对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的抽样误差即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异这种差异是有抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析实习二平均数也叫平均值,是一组数据典型或有代表性的值,这个值倾向于落在根据数据大小排列的数据的中心,包括算术平均值、几何平均数、中位数等均数指在一组数据中所有数据之和再除以数据的个数,是反应数据集中趋势的一个指标几何均数是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平中位数将一组观察值按升序或降序排列,位次居中的数,常用M表示百分位数是一种位置指标,以Px表示,一个百分位数Px将全部观察值分为两个部分,理论上有X%的观察值小于Px小,有(1-X%)的观察值大于Px全距(极差)最大与最小观察值之差标准差是描述个体值变异程度的指标,为方差的算术平方根变异系数用于观察指标单位不同或均数相差较大时两组资料变异程度的比较,用CV表示计算标准差/均数*100%简答与思考题1试诉频数表的要素与用途?要素组段、频距用途
①描述资料的分布特征和分布类型频数分布有两个重要特征集中趋势和离散趋势大部分观察值向某一数值集中的趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐频数由中央位置向两侧逐渐减少,成离散趋势,是个体差异所致,可用一系列的变异指标来反映
②便于进一步计算有关指标或进行统计分析当数据较多且需手工计算时,常先编制频数表,再进行统计计算
③发现特大、特小的可疑值如果频数表的一端或两端出现连续几个组段的频数为零后,又出现少数几个特大值或特小值,使人怀疑其是否准确,需进一步检查和核对并做相应处理
④当样本含量比较大时,可用各组段的频率作为概率的估计值2描述单变量资料的统计指标分哪两大类,分别是什么指标?分类
①描述数据分布集中趋势的指标算术均数、几何均数、中位数
②描述数据分布离散程度的指标极差、四分位数间距、方差、标准差、变异系数3试诉平均数、标准差、差异系数的含义与用途、平均数的指标的概念和作用概念平均数表示一组同质计量数据集中趋势的位置和平均水平作用是一组计量数据平均水平的代表值,可作为不同组间的比较值标准差反映数据的离散程度,反映一组数据变量值的变异程度,组间单位相同时,S越小,表示数据的变异程度越小变异系数标准差和平均数的比值,即s/a应用1)组间单位不同时变异程度的比较2)比较组单位相同,但均数相差悬殊的组间变异程度4什么对象可以作为医学正常参考值的正常人?如何制定95%正常参考值范围?所谓正常人不是指机体任何器官、组织的形态和机能都正常的而是符合特定水平的人1)确定诊断指标为“定性”或“定量”2)计量数据要确定其分布(正态或偏态)3)计量资料考虑制定单侧诊断界值还是双侧诊断界值4)有足够的样本例数(一般不低于100例)5标准正态分布曲线下面积有何分布规律?所有的正态分布曲线,在v左右的相同倍数的标准差范围内的面积相同并且,在丫土范围内的面积约为
68.3%;在v±l.96范围内的面积约为95%;在v±
2.58范围内面积约为99%o6同一资料的标准差是否一定小于均数?均数和标准差是两类不同性质的统计指标,标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度小,则该值小,标准差可大于均数,也可小于均数实习三抽样误差在同一总体中随机抽取样本含量相同的若干样本,是样本指标之间的差异以及样本指标与总体指标的差异标准误表示样本均数间的变异程度可信区间按一定的概率或可信度(1-)用一个区间估计总体参数所以范围,这个范围称作可信度1-a的可信区间,又称置信区间假设检验用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断第一类误差统计学上规定,拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误或第一类错误,I型错误的概率用a表示第二类误差统计学上规定,不拒绝实际上不成立的H0,这类“存伪”的错误称为H型错误或第二类错误,II型错误的概率用B表示t分布在总体均数为u,总体标准差为的正态总体中随机抽取n相等的许多样本,分别算出样本均数,这些样本均数呈正态分布,而当样本含量n不太小时,即使总体不呈正态分布,样布均数的分布也接近正态思考题1标准差和标准误有何区别与联系区别
(1)含义不用
①s描述个体变量值(X)之间的变异度大小,S越大,变量值(X)越分散;反之变量值越集中,均数打代表性就越强
②标准误是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小
(2)与n的关系不同n增大时,
①s-(恒定)
②标准误减少并趋于0(不存在抽样误差)
(3)用途不同
①s表示x的变异度大小,计算cv,估计正常值范围,计算标准误等
②x参数估计和假设检验联系二者均为变异度指标,样本均数的标准差及为标准误,标准差与标准误成正比2统计描述与统计推断分别应掌握哪些要点1)研究特点不同描述统计学研究如何简缩数据并描述这些数据的方法,一般包括统计调查方法,分类原理,汇总,统计表,统计图,频数分配,时间数列,指数,相关,估计推算等推断统计学研究如何在随机抽样的基础上推论有关总体数量特征的方法,一般包括:统计推断原上推论有关总体数量特征的方法,一般包括统计推断原理,实验设计,估计理论,抽样调查,复变数分析,序列分析,误差理论,假设检验,决策理论等2)研究样本不同描述统计学研究大样本理论,所谓大样本即包括多数个体或多数数值的样本;推断统计学肝究小样本理论,所谓小样本即包括少数个体或少数数恼的样本3)应用统计的性质不完全相同描述统计学派在应用统计一一生物统计、经济统计等方面,仍残留者凯特勒的实质科学的影响;推断统计学在应用统计一一物理统计、田间设计、质量管理、经济预测等方面,基本上已转变为通用的方法论科学3t检验、z检验的公式有哪些类型,在应用上有何异同t检验当样本例数n较小时,要求样本取自正态总体t检验的类型单样本t检验,独立t检验,配对t检验z检验样本例数较大,或n虽小而总体标准差已知相同点集中位置都为3都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)不同点t分布是一簇分布曲线,t分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为14在统计推断过程中,如何区别单侧检验与双侧检验如果将拒绝性概率平分于理论抽样分布的两侧,称为双侧检验例如选定显著性水平a二
0.05,双侧检验就是将a概率所规定的拒绝区域平分为两部分而置于概率分布的两边,每边占有二
0.025双侧检验只强调差异是否显著而不强调方向性如果将拒绝性概率置于理论抽样分布的一侧(左侧或右侧),称为单侧检验(右侧检验或左侧检验)单侧检验强调差异的方向性在具体的假设检验中,选择双侧检验或单侧检验可分为以下三种情况:第一种Ho□二R o:口W Ho双侧第二种Ho:U,口0:UUo单侧(左侧)第三种Ho:WH:UU单侧(右侧)U OO5总体可信区间与正常值范围有何不同应注意可信区间与参考值范围的意义、计算公式和用途均不同
1.从意义和用途来看95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可信度估计的总体均数的所在范围可信区间用于估计总体参数,总体参数只有一个参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限
2.从计算公式看若指标服从正态分布,95%参考值范围的公式是工±
1.96sX±£().Q5(丁]J总体均数95%可信区间的公式是°前者用标准差,后者用标准误前者用
1.96,后者用a为
0.05,自由度为v的t界值6假设检验和总体均数区间估计有何联系假设检验是对总体做出某种假定,然后根据样本信息推断总体是否成立的一类统计学方法总称假设检验有三个基本步骤
①建立假设和确定检验水准;
②选择检验方法和计算检验统计量;
③确定P值和做出统计推断结论总体均数的估计
1、点估计样本统计量直接作为总体指标的估计值它未考虑抽样误差的大小
2、区间估计按预先给定的概率(『a)确定的包含未知总体参数的可能范围7简述第1类错误与第2类错误的区别与联系区别I型错误(弃真)拒绝实际成立的H,型错误的概率记为a(1-a)即置信度:重复抽样时,样本区间包含总体参数(口)的百分数当pWa而拒绝H时,只能犯I型错误,不可能犯H型错误II型错误(存伪)不拒绝实际不成立的H,II型错误的概率记为B(1—B)即把握度(或检验效能两总体确有差别,被检出有差别的能力当pNa而拒绝H时,只能犯H型错误,不可能犯I型错误联系对同一资料,与B反方向变化,若要同时减小a与B,唯一的办法是增加样本含量实习四1方差分析的基本思想是什么方差分析的基本思想就是按研究目的和设计类型,将总变异的离均差平方和SS和自由度V分别分解成若干部分,并求得各相应部分的变异;其中的组内变异或误差主要反映个体差异或抽样误差,其它部分的变异与之比较得出统计量F值,由F值的大小确定P值,并做出推断2方差分析有何特性1)各样本是相互独立的随机样本2)各样本来自正态分布3)各处理组总体方差相等,及方差齐3t检验与F检验的适用条件和应用范围有何异同t检验适用于两个样本均数的比较,F检验适用于多个样本的比较t检验的应用条件:要求各样本来自相互独立的正态总体且各总体方差齐方差分析的应用条件
(1)各样本是相互独立的随机样本,且来自正态分布总体
(2)各样本的总体方差相等,即方差齐性4配对比较的t检验与配伍组比较的方差分析之间有何关系?两独立样本均数比较的t检验与两独立样本均数比较F检验之间有何联系1)两者都要求比较的资料服从正态分布;2)而且两样本均数的比较及方差分析均要求比较组有相同的总体方差;3)配伍组比较的方差分析是配对比较t检验的推广,成组设计多个样本均数比较的方差分析是两样本均数比较t检验的推广;4)对于两个样本之间的比较,方差分析和t检验效果是相同的,两独立样本均数比较应用t检验的条件之一就是方差齐性,其中要判断两总体方差是否相等,就可以用F检验简单的说就是检验两个样本的方差是否有显著性差异,这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件5多个样本均数比较方差分析的获得组间差异有统计意义(P
8.05),问是否已完成该资料的分析?为什么?没有拒绝H,接受乩,表示总体均数不全相等,而要知道哪两两均数不相等和哪两辆均数不等,还需要进一步作多重比较实习五1常用相对数指标有哪些?它们在计算和意义上有何不同?率(强度相对数,频率相对数)、构成比、相对比应用相对数时应注意的问题⑴计算相对数的分母一般不宜过小⑵分析时不能以构成比代替率⑶不能用构成比的动态分析代替率的动态分析⑷对观察单位数不等的几个率,不能直接相加求其总率⑸在比较相对数时应注意可比性⑹对样本率(或构成比)的比较应随机抽样,并做假设检验2率的标准化的意义及基本思想是什么?当比较的两组资料内部各小组率明显不同,且各小组观测例数的构成比也明显不同时,直接比较两个合计率是不合理的因为期内部构成比不同,往往影响合计率的大小,需要统一的内部构成进行调整后计算标准化率,使其具有可比性,这种方法称为率的标准化率的标准化的基本思想要比较两个总率时,发现两组资料的内部构成(如年龄、性别构成。
个人认证
优秀文档
获得点赞 0