还剩58页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
差异显著性检验欢迎参加差异显著性检验课程!本课程将系统介绍各种统计检验方法,帮助您在科研和数据分析中正确判断样本之间的差异是否具有统计学意义从基础的检验到高级的方差分析,从参数检验到非参数检验,我们t将全面讲解不同场景下的显著性检验方法通过本课程的学习,您将能够选择合适的统计方法,正确设置假设,并准确解释检验结果,为您的研究决策提供科学依据无论您是统计学初学者还是希望提升数据分析能力的研究人员,本课程都将为您提供系统而实用的知识框架课程概述课程目标内容结构掌握各类差异显著性检验的课程分为九章,从统计学基基本原理与应用方法,培养础知识入手,依次介绍假设正确选择和使用统计方法的检验、检验、方差分析、t能力,提高科研数据分析的相关分析、回归分析、卡方准确性和可靠性检验和非参数检验等内容,最后讲解统计软件的实际应用学习方法理论讲解与实例分析相结合,课后练习与实际数据操作相辅助,建议边学习边实践,以加深对统计方法的理解和应用能力第一章统计学基础数据收集数据整理获取研究所需的原始数据对收集的数据进行分类和排序结果解释数据分析对分析结果进行科学解释应用统计方法进行数据处理统计学是研究数据收集、整理、分析和解释的科学在进行差异显著性检验前,我们需要先了解统计学的基本概念和方法本章将介绍统计学的定义、分类、基本术语以及数据分布等内容,为后续各种检验方法的学习奠定基础统计学的定义和应用统计学定义主要领域应用统计学是一门收集、整理、分析数医学研究(临床试验、流行病学)据并从中得出有效结论的科学,它、社会科学(问卷调查、民意测验为各种不确定性问题提供量化分析)、经济分析(市场预测、经济指工具标)、工业生产(质量控制、可靠性分析)统计学思维建立在概率基础上,接受不确定性的存在,通过对样本的合理推断来认识总体规律,是科学研究方法的重要组成部分统计学已成为各个学科不可或缺的工具在医学研究中,统计方法帮助评估新药效果;在市场营销中,它指导企业了解消费者行为;在农业实验中,它帮助确定最优种植方法掌握统计学知识,能让我们在面对复杂数据时,做出更科学的判断和决策描述统计与推断统计描述统计推断统计描述统计关注对已有数据的概括和描述,帮助我们理解数据推断统计基于样本数据对总体特征进行推断,是差异显著性的基本特征检验的理论基础集中趋势测量均值、中位数、众数参数估计点估计、区间估计••离散程度测量方差、标准差、极差假设检验显著性检验、值判断••p分布形状描述偏度、峰度统计建模回归分析、方差分析••数据可视化直方图、箱线图、散点图预测与决策置信区间、预测区间••在实际研究中,描述统计和推断统计通常是相互结合使用的我们先通过描述统计了解数据的基本特征,然后利用推断统计对研究假设进行检验,最终得出关于总体的科学结论总体与样本样本统计量1从样本计算的数值样本2从总体中抽取的部分个体总体3研究对象的全体在统计学中,总体是指我们感兴趣的所有研究对象的集合,而样本则是从总体中抽取的一部分对象由于研究全部总体通常不现实(成本高、时间长或不可能),我们通常通过对样本的研究来推断总体特征样本的代表性至关重要,良好的抽样方法(如简单随机抽样、分层抽样、整群抽样等)可以确保样本能够较为准确地反映总体特征总体参数用希腊字母表示(如总体均值、总体标准差),而样本统计量通常用英文字母表示(如样本均值、样本标准差)μσx̄s变量类型定性变量不能用数值表示或数值无实际计算意义的变量名义变量仅表示类别,没有顺序关系(如性别、血型)顺序变量有顺序关系但没有固定的度量单位(如教育程度)定量变量可以用数值表示且数值有实际计算意义的变量间隔变量数值间隔有意义但没有真正的零点(如温度)比率变量有真正零点且比值有意义(如身高、体重)变量类型的正确识别对于选择合适的统计方法至关重要不同类型的变量适用于不同的统计分析方法,如名义变量常用卡方检验,顺序变量可用非参数检验,而间隔和比率变量则可以使用各种参数检验数据分布正态分布呈钟形曲线,对称分布在均值周围,是最常见的连续型概率分布标准正态分布均值为0,标准差为1•68%的数据落在均值±1个标准差范围内•95%的数据落在均值±2个标准差范围内•
99.7%的数据落在均值±3个标准差范围内t分布与正态分布相似但尾部更厚,当样本量增大时趋近于正态分布在小样本情况下用于均值的区间估计和假设检验卡方分布非对称分布,常用于卡方检验中形状取决于自由度,随自由度增加趋于对称F分布非负连续型概率分布,在方差分析中用于比较不同组别之间的方差了解数据的分布类型对于选择适当的统计分析方法非常重要大多数参数检验方法都假设数据服从正态分布,如果数据不满足这一假设,则可能需要选择非参数检验方法或对数据进行转换第二章假设检验概述提出假设建立原假设H₀和备择假设H₁确定显著性水平通常选择α=
0.05或α=
0.01计算检验统计量根据样本数据计算相应的统计量确定p值计算在原假设成立情况下观察到当前或更极端结果的概率做出决策若p值≤α,则拒绝原假设;若p值α,则不拒绝原假设假设检验是推断统计学的核心内容,为我们提供了一套系统的方法来判断样本数据中观察到的差异是否具有统计学意义本章将详细介绍假设检验的基本思想和关键概念,为后续各种具体检验方法的学习奠定基础假设检验的基本思想怀疑态度假设检验的核心是采取怀疑态度,假定没有显著差异或效应存在(即原假设),然后通过数据证明这种假定是错误的反证法思路如果在原假设为真的条件下,观察到当前或更极端结果的概率很小,则拒绝原假设,接受备择假设基于概率的决策通过计算p值(概率值)来量化证据强度,p值越小,反对原假设的证据越强统计显著性判断通过与预设的显著性水平α比较,判断结果是否达到统计显著性假设检验类似于法庭审判中的无罪推定原则我们首先假设被告无罪(原假设),然后看证据是否足够强有力以推翻这一假设在统计学中,我们假设无效应或无差异,然后通过样本数据检验这一假设是否成立原假设与备择假设原假设₀备择假设₁HH又称零假设,表示无差异或无效应的保守陈述与原假设相对立的陈述,表示研究者期望证明的结论通常包含等号通常包含不等号•=,≤,≥•≠,,假定为真,直到有足够证据推翻它当拒绝原假设时被接受••例₀₀样本均值等于某特定值例₁₀双侧检验•H:μ=μ•H:μ≠μ例₀₁₂两组样本均值相等例₁₁₂单侧检验•H:μ=μ•H:μμ原假设和备择假设的设定是假设检验的第一步,也是至关重要的一步它们必须相互排斥且共同构成完备的可能性集合研究问题的本质和研究目的决定了假设的具体形式单侧检验单尾检验用于研究方向性问题,如新药是否优于旧药;双侧检验双尾检验用于研究是否有差异但不预设差异方向,如两种教学方法是否有效果差异显著性水平()α值定义常用值与决策ααα显著性水平是研究者事先设定的阈科学研究中最常用的显著性水平是当值时,结果被认为具有统计显αp≤α值,表示在原假设为真的条件下,错,表示允许有的概率错著性,我们拒绝原假设当值时
0.055%5%pα误拒绝原假设的最大允许概率它反误地拒绝真实的原假设其他常用的,结果不具有统计显著性,我们不能映了研究者愿意承担的第一类错误的值还包括和,拒绝原假设值必须在分析数据前α
0.011%
0.
0010.1%α风险更严格的领域可能使用更小的值确定,不应根据结果调整α显著性水平的选择反映了研究的严谨程度和对错误决策的容忍度在不同领域,值的选择可能有所不同医学药物研究因涉及人体安全通α常会选择更小的值如或,而初步探索性研究可能采用较大的值如或α
0.
010.001α
0.
050.1第一类错误与第二类错误原假设₀为真原假设₀为假H H接受₀正确决策第二类错误Hβ拒绝₀第一类错误正确决策Hα在假设检验中,我们可能会犯两种错误第一类错误和第二类错误第一类错误错误是指原假设实际上为真,但我们错误地拒绝了它,俗称弃真第一α类错误的概率就是我们设定的显著性水平α第二类错误错误是指原假设实际上为假,但我们错误地接受了它,俗称取β伪第二类错误的概率用表示称为统计功效,表示当原假设为假时正β1-β确拒绝原假设的概率两类错误之间存在权衡关系在样本量固定的情况下,减少一类错误的概率会增加另一类错误的概率实际研究中需要根据研究目的和可能的后果来平衡这两类错误的风险值的概念和解释pp值的定义p值是在原假设为真的条件下,观察到当前或更极端结果的概率它衡量了样本数据与原假设的不一致程度,是假设检验中用于量化证据强度的核心指标p值与α的比较将计算得到的p值与预先设定的显著性水平α进行比较若p≤α,则拒绝原假设;若pα,则不能拒绝原假设p值越小,反对原假设的证据越强p值的常见误解p值不是原假设为真的概率,也不是研究结果偶然出现的概率p值大并不意味着证明了原假设,只是表示没有足够证据拒绝原假设p值是假设检验中最常用也最容易被误解的概念正确解读p值对于科学研究至关重要例如,p=
0.03意味着如果原假设为真,那么获得当前或更极端结果的概率为3%由于这个概率很小,我们倾向于认为原假设不太可能为真,因此拒绝它统计功效和样本量1-β
0.80统计功效常用功效值当原假设为假时正确拒绝它的概率科研中常用的最低功效标准4影响因素影响统计功效的主要因素数量统计功效Power是检验能力的重要指标,表示当备择假设为真时,正确拒绝原假设的概率功效越高,检验越敏感,越能检测出真实存在的效应一般而言,在研究设计阶段应该确保功效至少达到
0.880%影响统计功效的主要因素包括样本量n、效应量大小如均值差异的大小、显著性水平α以及数据变异性如标准差其中,增加样本量是提高统计功效最直接有效的方法通过功效分析可以在研究前计算所需的最小样本量,确保研究能够检测出有意义的效应第三章检验t单样本t检验比较一组样本均值与已知总体均值独立样本t检验比较两个独立组的均值差异配对样本t检验比较相依组前后测量的差异t检验是最常用的参数检验方法之一,用于比较均值之间的差异是否显著它基于t分布,特别适用于小样本情况本章将详细介绍t检验的三种主要形式单样本t检验、独立样本t检验和配对样本t检验,包括它们的应用场景、基本原理、计算方法以及结果解释理解t检验的原理和应用对于研究者正确分析实验数据至关重要随着研究问题和设计的不同,选择适当类型的t检验可以提高分析的准确性和效率在实际应用中,t检验是探索变量之间关系的基础工具单样本检验t应用场景计算公式假设设定当需要比较一个样本的,其₀₀样本均值t=x̄-μ/s/√n H:μ=μ均值与已知的总体均值中为样本均值,为假等于假设的总体均值x̄μ或理论值是否有显著差设的总体均值,为样s₁₀双侧检验H:μ≠μ异时使用例如,检验本标准差,为样本量n或₁₀或₁H:μμH:某班学生的平均成绩是自由度df=n-1₀单侧检验μμ否与全校平均水平存在差异单样本检验要求样本来自近似正态分布的总体当样本量较大通常时tn30,即使总体分布偏离正态,中心极限定理也使得检验具有较强的稳健性t在实际应用中,单样本检验常用于质量控制检验产品是否符合标准、教育评t估比较学生成绩与标准分数以及医学研究比较患者指标与正常参考值等领域独立样本检验t应用场景计算公式用于比较两个独立样本的均值是否有显著差异样本之间没等方差情况有配对或匹配关系₁₂₁₂t=x̄-x̄/s_p×√1/n+1/n例如其中为合并标准差,自由度₁₂s_p df=n+n-2比较男性和女性的平均身高•非等方差情况Welchs ttest比较两种不同教学方法的效果•₁₂₁₁₂₂t=x̄-x̄/√s²/n+s²/n比较实验组和对照组的治疗效果•自由度需要特殊计算独立样本检验的关键假设包括两组样本分别来自近似正态分布的总体;两组样本相互独立;两组总体方差近似相等虽然有t不等方差的调整方法在进行独立样本检验前,通常先进行测试检验方差是否相等,以决定使用哪种形式的检验t Levenest配对样本检验t应用场景分析原理用于分析同一受试对象在两种不同条件配对t检验实质上是对配对差值进行的单下或前后测量的差异样本之间存在一样本t检验,检验差值的平均值是否显著一对应的关系常见于以下情况不等于零•前测-后测设计如培训前后的能力变计算公式t=d̄/s_d/√n化其中d̄是配对差值的平均值,s_d是差值•匹配对照设计如双胞胎研究的标准差,n是配对数量,自由度df=n-•重复测量设计如同一患者使用两种1药物的反应优势特点相比独立样本t检验,配对设计可以控制个体差异的影响,减少误差变异,提高统计检验的功效当样本内个体差异较大时,配对设计尤为有效配对样本t检验要求配对差值近似服从正态分布在实践中,可以通过直方图、Q-Q图或正态性检验如Shapiro-Wilk检验来验证这一假设当样本量较小且差值分布严重偏离正态时,可考虑使用非参数方法如Wilcoxon符号秩检验作为替代检验的应用条件t独立性假设1样本数据应该相互独立,尤其对于独立样本t检验在配对样本设计中,配对差值应相互独立抽样方法应确保样本的随机性和代表性正态性假设2样本应来自近似正态分布的总体可以通过直方图、正态概率图或正态性检验如Shapiro-Wilk检验来验证当样本量大于30时,由于中心极限定理,即使总体分布偏离正态,t检验也相对稳健方差同质性假设3对于独立样本t检验,两组总体方差应近似相等可以通过Levenes检验或F检验来验证如果方差不等,可以使用Welch-Satterthwaite调整的t检验测量尺度要求4被测变量应该是连续变量或近似连续的有序变量,以确保均值是有意义的统计量对于明显不满足正态分布或为等级变量的数据,应考虑使用非参数检验在实际研究中,t检验对一些假设的轻微违反具有较强的稳健性,尤其是在样本量较大时然而,严重违反这些假设可能导致检验结果不可靠当数据不满足t检验的应用条件时,可以考虑数据转换如对数转换、平方根转换或使用替代的非参数方法检验的步骤t设定假设1明确原假设H₀和备择假设H₁,确定是进行单侧检验还是双侧检验例如,对于独立样本t检验,H₀:μ₁=μ₂,H₁:μ₁≠检查假设条件μ₂双侧检验验证数据是否满足t检验的基本假设独立性、正态性、方差同质性对独立样本t检验等必要时进行数据转换或考虑非参数替代方法计算检验统计量根据t检验类型使用相应公式计算t值和自由度这一步通常由统计软件完成4确定p值根据t值、自由度和检验类型单侧或双侧确定p值现代统计软件会直接提供p值决策与解释将p值与预设的显著性水平α比较,决定是否拒绝原假设正确解释结果,包括效应大小的评估进行t检验时,除了关注p值的显著性外,还应计算并报告效应大小如Cohens d和置信区间,以提供更全面的信息效应大小可以帮助判断差异的实际意义,而置信区间则提供了效应真实值的可能范围检验结果的解释t显著性解释非显著性解释效应大小评估如果p≤α如p≤
0.05,则结如果pα,则结果不具有统使用标准化指标如Cohens果具有统计显著性,拒绝原计显著性,不能拒绝原假设d来评估差异的实际意义假设,支持备择假设这表这并不意味着原假设为真一般而言,d=
0.2为小效应明观察到的差异不太可能仅,只是表明没有足够证据证,d=
0.5为中等效应,d=
0.8由抽样误差引起明它是假的为大效应例如两组均值之间存在例如两组均值之间无统报告置信区间也有助于评估统计学显著差异计学显著差异t42=
1.65,结果的实际意义和精确度t28=
3.45,p=
0.002p=
0.107解释t检验结果时,应避免常见误区,如将不显著误解为无差异,或过度依赖p值而忽视效应大小统计显著性仅表明数据与原假设不一致的程度,不直接反映差异的实际重要性或实用价值完整的结果报告应包括描述统计如均值、标准差、检验统计量t值、自由度、p值、效应大小以及置信区间,并与研究问题和背景结合进行实质性解释第四章方差分析()ANOVA单因素方差分析双因素方差分析比较三个或更多独立组的均值差异同时研究两个因素对因变量的影响1混合设计方差分析重复测量方差分析结合组间和组内因素的设计分析同一受试者在不同条件下的表现方差分析是一种强大的统计方法,用于比较两个或多个组的均值是否存在显著差异它通过分析数据变异的来源,将总变异分解ANOVA为组间变异和组内变异,从而评估不同处理或条件对研究变量的影响本章将深入探讨方差分析的基本原理、主要类型及其应用场景,帮助您掌握这一重要的统计工具方差分析是实验研究中最常用的分析方法之一,对于理解多组数据之间的关系具有重要意义单因素方差分析基本概念变异分解单因素方差分析用于比较三个或更多独立单因素方差分析的核心思想是将总变异分解为组间变One-way ANOVASST样本组的均值是否存在显著差异它检验的是一个自变量异和组内变异SSB SSW因素对因变量的影响SST=SSB+SSW原假设₀₁₂所有组均值相等H:μ=μ=...=μₖ组间变异反映了不同处理的效应,组内变异反映了随机误差备择假设₁至少有两组均值不等通过比较这两种变异,可以判断组间差异是否显著大于随H:机变异检验统计量计算为,其中,,为组数,为总样本量F F=MSB/MSW MSB=SSB/k-1MSW=SSW/N-k kN当值大且值小于显著性水平时,我们拒绝原假设,认为至少有两组之间存在显著差异但本身不能告诉我们具体哪F pANOVA些组之间存在差异,为此需要进行事后检验,如、、等方法post-hoc testsTukeys HSDBonferroni Scheffé双因素方差分析基本概念双因素方差分析Two-way ANOVA同时考察两个自变量因素对因变量的影响,不仅能分析每个因素的主效应,还能评估两因素之间的交互效应主效应主效应是指一个因素对因变量的影响,不考虑其他因素的水平双因素ANOVA可以分别检验两个因素的主效应例如药物主效应不同药物对症状改善的影响和剂量主效应不同剂量对症状改善的影响交互效应交互效应指一个因素的影响取决于另一个因素的水平当交互效应显著时,单独解释主效应可能会产生误导例如某药物在低剂量时对男性效果好而对女性效果差,但在高剂量时情况相反,这就是典型的交互效应假设检验双因素ANOVA通常包括三个假设检验两个主效应检验和一个交互效应检验每个检验都有自己的F值和p值双因素方差分析在实验设计更复杂、研究问题更丰富的情况下特别有用它不仅能提高统计效率相比于分别进行单因素分析,还能探索因素间的相互关系,揭示更为丰富的现象规律方差分析的基本原理变异分解平均平方方差分析的核心原理是将观测数据的总变为了考虑自由度的影响,方差分析计算各异分解为可解释部分如处理效应和不可解变异来源的平均平方释部分如随机误差,然后比较这些变异来•组间平均平方MSB=SSB/k-1源的相对大小•组内平均平方MSW=SSW/N-k•总平方和SST总体变异其中k为组数,N为总样本数•组间平方和SSB由分组或处理导致的变异•组内平方和SSW组内随机变异误差F比率F=MSB/MSW是检验统计量当原假设为真所有组均值相等时,F值应接近1F值显著大于1表明组间变异显著大于随机变异,提供了反对原假设的证据方差分析构建在几个关键假设基础上样本独立性、组内数据正态分布、各组方差同质性等方差在实际应用中,需要检验这些假设是否满足,必要时采取适当措施如数据转换、稳健版本的ANOVA等应对假设违反的情况分布和检验F FF检验结论1p值与α比较,决定是否拒绝原假设p值计算2根据F统计量和自由度计算概率F统计量3F=MSB/MSW,比较组间和组内变异F分布4由两个独立卡方变量比值确定的概率分布F分布是一种连续型概率分布,由两个独立卡方变量的比值定义它是非对称的右偏分布,形状由两个自由度参数决定分子自由度dfB和分母自由度dfW在方差分析中,dfB=k-1k为组数,dfW=N-kN为总样本量F检验是方差分析的核心,用于判断组间均值是否存在显著差异当计算得到的F值大于临界值或对应的p值小于显著性水平α时,我们拒绝所有组均值相等的原假设,认为至少存在两组之间的均值差异具有统计显著性F检验是单尾检验,我们只关心F值是否显著大于1,因为只有当组间变异显著大于组内变异时,才提供了处理效应存在的证据方差分析的应用条件独立性假设各组样本应相互独立,即一个观测值不应影响另一个观测值这主要通过合适的实验设计和随机分配来保证重复测量设计需要使用专门的方差分析方法正态性假设每组数据应近似服从正态分布可以通过直方图、Q-Q图或正态性检验如Shapiro-Wilk检验来验证当样本量较大时,由于中心极限定理,方差分析对这一假设的违反具有一定稳健性方差齐性假设各组应具有相近的方差,即方差同质性可以通过Levenes检验或Bartletts检验来验证如果方差差异显著,可以考虑数据转换或使用Welchs ANOVA等替代方法测量尺度要求因变量应为连续变量或近似连续的有序变量,自变量分组变量通常为分类变量对于明显不满足上述假设的情况,可考虑使用非参数方法,如Kruskal-Wallis检验在实际应用中,方差分析对假设的轻微违反具有一定的稳健性,特别是当各组样本量相等且较大时然而,严重违反这些假设可能导致结果不可靠,增加犯第一类或第二类错误的风险方差分析的步骤明确研究问题与假设1确定研究目标,明确自变量因素和因变量,设立原假设H₀:所有组均值相等和备择假设H₁:至少有两组均值不等设计研究与收集数据设计合适的实验或观察研究,确保样本随机性、独立性和足够的样本量,进行数据收集探索性数据分析计算描述统计如均值、标准差,绘制可视化图表如箱线图,检查数据分布和异常值,验证方差分析的假设条件是否满足执行方差分析计算总平方和SST、组间平方和SSB、组内平方和SSW,计算F值,确定p值并与显著性水平比较,做出统计决策进行事后检验如需5如果ANOVA结果显著,进行多重比较或事后检验如Tukeys HSD、Bonferroni等,确定具体哪些组之间存在显著差异解释结果并得出结论结合研究背景解释统计结果,考虑效应大小如η²评估实际意义,形成结论并探讨局限性现代统计软件如SPSS、R或Python可以自动执行大部分计算步骤,但研究者仍需理解基本原理以正确选择分析方法、设置参数和解释结果方差分析结果的解释F pF值解释显著性判断F值越大,提供的反对原假设的证据越强F≈1表示组p≤α通常α=
0.05表示结果具有统计显著性,拒绝所间和组内变异相似,可能无显著差异有组均值相等的原假设η²效应大小评估效应大小衡量差异的实际意义常用指标包括η²、偏η²或ω²,评估自变量解释的因变量变异比例当方差分析结果显著时,需进行事后检验以确定具体哪些组之间存在显著差异不同的事后检验方法有不同的特点Tukeys HSD平衡了第一类错误控制和检验功效;Bonferroni更严格控制第一类错误但可能降低功效;Dunnetts专门用于将多个处理组与单一对照组比较报告方差分析结果时,应包括F统计量、自由度、p值、效应大小以及事后检验结果例如单因素方差分析显示三种教学方法对学生成绩有显著影响F2,87=
15.48,p
0.001,η²=
0.26Tukey事后检验表明,方法AM=
85.6,SD=
6.2显著优于方法BM=
78.3,SD=
7.1,p=
0.002和方法CM=
74.5,SD=
8.3,p
0.001第五章相关分析理解相关概念相关分析研究两个变量之间线性关系的强度和方向,不涉及因果关系的判断选择相关系数根据数据类型和分布选择适当的相关系数Pearson、Spearman等计算与检验计算相关系数并进行显著性检验,判断相关是否显著不为零解释相关结果根据相关系数的大小和方向解释变量间关系,考虑统计和实际显著性相关分析是研究两个变量之间关系的基本统计方法,广泛应用于心理学、医学、经济学等领域相关分析可以量化两个变量共同变化的程度和方向,但不能确定因果关系本章将详细介绍相关系数的概念、计算方法和解释,着重讨论Pearson积矩相关系数和Spearman等级相关系数这两种最常用的相关分析方法,以及它们的应用条件和分析步骤理解相关分析对于探索变量之间的关系以及为进一步的因果分析奠定基础至关重要相关系数的概念正相关负相关相关系数为正值0到+1,表示一个变量增相关系数为负值-1到0,表示一个变量增加时另一个变量也倾向于增加加时另一个变量倾向于减少定义无相关相关系数是量化两个变量之间线性关系强度和方向的统计指标,通常取值范围为-1相关系数接近0,表示两个变量之间无明到+1显线性关系2314相关系数的绝对值表示相关强度|r|接近1表示强相关,|r|接近0表示弱相关一般而言,|r|
0.3为弱相关,
0.3≤|r|
0.7为中等相关,|r|≥
0.7为强相关,但这种划分在不同领域可能有所不同需要注意的是,相关不等于因果关系两个变量之间存在相关可能是因为一个变量直接影响另一个变量;两个变量受共同第三变量影响;或纯属巧合尤其是在小样本情况下此外,相关系数只测量线性关系,对于非线性关系可能低估了变量间的实际关联程度相关系数Pearson定义与计算应用条件积矩相关系数是最常用的相关系数,测量两个连相关系数有几个基本前提Pearson rPearson续变量之间的线性关系强度其计算公式为两个变量均为连续变量或近似连续的等距变量•r=Σ[Xi-X̄Yi-Ȳ]/√[ΣXi-X̄²ΣYi-Ȳ²]两个变量之间存在线性关系•数据近似服从双变量正态分布其中和是第个观测值,和是两个变量的均值•Xi Yii X̄Ȳ数据中没有显著的异常值•使用相关系数前,应通过散点图检查两变量之间是否存在线性关系,并检查是否有显著的异常值可能扭曲相关结果Pearson当数据严重违反上述假设时,尤其是关系不是线性的或存在明显异常值时,应考虑使用等级相关系数等替代方法Spearman相关的显著性检验原假设是总体相关系数,即两变量无线性相关如果计算得到的值小于显著性水平通常为Pearsonρ=0p,我们拒绝原假设,认为两变量之间存在显著的线性相关关系
0.05等级相关系数Spearman定义与计算适用场景Spearman等级相关系数rs或ρ是基于数据排Spearman相关系数特别适用于以下情况序的相关系数,测量两个变量之间的单调关系•数据为顺序变量或等级数据不一定是线性的计算方法是对原始数据进行•数据不符合正态分布假设排序,然后对排序值使用Pearson相关公式当没有并列排名时,可使用简化公式•变量间关系不是线性的而是单调的•数据中存在可能影响Pearson相关系数的rs=1-6Σd²/[nn²-1]异常值其中d是每对数据排名之差,n是样本量优势特点与Pearson相关系数相比,Spearman相关系数具有以下优势•对异常值不敏感,具有较强的稳健性•不要求数据服从正态分布•可以检测非线性但单调的关系•适用于无法精确测量但可以排序的情况Spearman相关的显著性检验与Pearson相关类似,原假设是总体等级相关系数ρs=0小样本情况下使用特定的临界值表,大样本情况下可近似使用t检验相关分析的应用条件相关系数条件相关系数条件Pearson Spearman使用相关系数需要满足以下条件使用等级相关系数需要满足的条件较少Pearson Spearman两个变量均为连续变量或近似连续的等距变量两个变量至少为顺序变量••两个变量之间应存在线性关系可通过散点图检查两个变量之间应存在单调关系但不必是线性的••两个变量的联合分布近似服从双变量正态分布观测值之间应相互独立••数据中不存在极端异常值•相关不要求数据服从正态分布,对异常值也不敏感Spearman数据应满足同方差性,即值在的不同水平上的变异程度•Y X,因此适用范围更广应相似在开始相关分析前,应仔细检查数据是否满足以上条件如果数据不满足相关的假设,可以考虑使用相关或其Pearson Spearman他非参数方法有时也可以通过数据转换如对数转换、平方根转换使数据更接近满足相关的假设Pearson需要注意的是,相关分析只能检测变量间的关联性,无法证明因果关系此外,相关系数对样本量敏感,在小样本情况下可能不稳定,在大样本情况下即使很小的相关也可能在统计上显著因此,除了关注统计显著性,还应评估相关的实际意义相关分析的步骤数据探索首先进行描述性统计分析计算均值、标准差等,并创建散点图以直观显示两个变量之间的关系通过散点图可以初步判断关系类型线性或非线性、方向正相关或负相关以及是否存在异常值检查假设根据散点图和数据分布情况,检查相关分析的应用条件是否满足如果数据满足Pearson相关的假设条件线性关系、双变量正态分布等,则选择Pearson相关;否则考虑Spearman等级相关计算相关系数使用适当的公式或统计软件计算相关系数r或rs现代统计软件如SPSS、R或Python可以轻松完成这一步骤进行显著性检验检验相关系数是否显著不为零计算t统计量或直接获取p值,与预设的显著性水平α比较原假设H₀:ρ=0总体相关系数为零,备择假设H₁:ρ≠0双侧检验或H₁:ρ0或ρ0单侧检验解释结果根据相关系数的大小和方向解释两个变量之间的关系,并结合p值判断该关系是否具有统计显著性还应计算决定系数r²,表示一个变量能解释另一个变量变异的比例进行多变量研究时,通常会计算多个变量对之间的相关,形成相关矩阵此时需要注意多重检验问题,可能需要进行Bonferroni等校正以控制总体第一类错误率相关分析结果的解释相关强度解释相关方向解释统计显著性解释相关系数的绝对值表示相关的强度相关系数的符号表示相关的方向p值表示相关系数偶然出现的概率通常的解释标准如下但在不同领域可能有所不同•正值+两个变量同向变化•p≤α:相关具有统计显著性,•|r|
0.3:弱相关,一个增加另一个也增加拒绝无相关原假设•
0.3≤|r|
0.7:中等相关•负值-两个变量反向变化•pα:相关不具有统计显著性•|r|≥
0.7:强相关,一个增加另一个减少,不能拒绝无相关原假设决定系数解释r²决定系数表示一个变量变异被另一个变量解释的比例例如,r=
0.7意味着r²=
0.49,即一个变量解释了另一个变量49%的变异在解释相关结果时,需要注意以下几点相关不意味着因果关系;相关只测量线性关系,可能低估非线性关系;大样本下小相关也可能具有统计显著性,但实际意义可能有限;相关系数对极端值敏感,异常值可能显著影响结果第六章回归分析预测应用1利用回归方程预测新数据回归诊断2检查模型假设和拟合质量参数估计与检验3估计回归系数并进行显著性检验模型构建4确定自变量与因变量,建立回归方程回归分析是一种强大的统计方法,用于探索自变量预测变量与因变量结果变量之间的关系,并建立可用于预测的数学模型与相关分析只关注变量间关系的强度和方向不同,回归分析可以量化这种关系,建立预测方程,并评估预测的准确性本章将介绍回归分析的基本概念和类型,从简单线性回归到多元线性回归,包括回归方程的建立、回归系数的检验、模型拟合优度评估以及回归分析结果的解释回归分析是数据建模和预测的基础工具,掌握这一方法对于理解变量间的复杂关系至关重要简单线性回归回归方程参数估计简单线性回归建立一个自变量与一个因变量之间的线性关系模简单线性回归通常采用最小二乘法估计参数,即寻找使残差平方和X Y型最小的参数值₀₁₁Y=β+βX+εb=Σ[Xi-X̄Yi-Ȳ]/ΣXi-X̄²其中₀是截距,₁是斜率回归系数,是误差项根据样本数₀₁ββεb=Ȳ-b X̄据估计的回归方程通常表示为其中和分别是和的样本均值X̄ȲX Y₀₁Ŷ=b+b X其中是的预测值,₀和₁是₀和₁的估计值ŶY bbββ回归线可以理解为在散点图中最适合数据点的直线,使得预测值与实际值之间的误差残差平方和最小回归分析不仅提供了变量间关系的描述,还允许我们根据的值预测的值X Y简单线性回归的假设包括线性关系、误差项独立性、误差项正态分布、误差项方差同质性等方差违反这些假设可能导致参数估计偏差、标准误差不准确或显著性检验无效在应用回归模型前,应通过残差分析等方法检验这些假设是否满足多元线性回归回归方程多元线性回归模型包含多个自变量Y=β₀+β₁X₁+β₂X₂+...+βX+εₚₚ其中Y是因变量,X₁,X₂,...,X是p个自变量,β₀是截距,β₁,β₂,...,β是各自变量的回归ₚₚ系数,ε是误差项系数解释在多元回归中,每个回归系数βᵢ表示当其他自变量保持不变时,自变量Xᵢ每增加一个单位,因变量Y的平均变化量这被称为控制其他变量后的偏效应参数估计多元回归通常也使用最小二乘法估计参数,但计算过程更复杂,通常需要矩阵运算现代统计软件可以自动完成这些计算多重共线性多元回归的一个重要问题是自变量之间可能存在高相关性多重共线性,这会导致回归系数估计不稳定、标准误差增大可以通过计算方差膨胀因子VIF来检测多重共线性多元回归比简单回归更复杂但也更强大,它能同时考虑多个因素对因变量的影响,更好地解释因变量的变异此外,通过控制潜在的混淆变量,多元回归可以更准确地估计感兴趣变量的效应回归方程的建立明确研究问题确定研究目标,明确因变量和可能的自变量根据理论基础和先前研究选择相关变量,避免盲目包含过多变量探索性数据分析通过散点图、相关分析等检查变量间关系验证线性关系假设,检测异常值和影响点,评估变量分布特征,必要时进行数据转换变量选择方法在多元回归中,选择最佳自变量组合的常用方法包括•强制录入法基于理论同时放入所有自变量•逐步回归法依据统计标准逐个添加或删除变量•前向选择法从空模型开始逐步添加变量•后向剔除法从完全模型开始逐步删除变量模型诊断与完善检查残差是否满足正态性、独立性、等方差性等假设分析影响点和杠杆点处理多重共线性问题必要时调整模型,如添加交互项、多项式项等建立回归方程不仅是一个统计过程,也是一个理论驱动的过程模型应该既符合统计原则,又具有实质性解释意义在变量选择时,要平衡模型的复杂性和解释力,避免过度拟合overfitting应用信息准则如赤池信息准则AIC或贝叶斯信息准则BIC可以帮助选择最佳模型回归系数的检验单个系数检验整体模型检验对每个回归系数βᵢ进行t检验,检验其是否显使用F检验评估整个回归方程的显著性,检验著不等于零是否至少有一个回归系数不为零原假设H₀:βᵢ=0该自变量对因变量无显著原假设H₀:β₁=β₂=...=β=0所有自ₚ影响变量对因变量均无显著影响备择假设H₁:βᵢ≠0双侧检验或βᵢ0或βᵢ备择假设H₁:至少有一个βᵢ≠00单侧检验检验统计量F=MSR/MSE,其中MSR是回检验统计量t=bᵢ/SEbᵢ,其中bᵢ是βᵢ的估计归均方,MSE是误差均方值,SEbᵢ是其标准误系数置信区间除了显著性检验,还应计算回归系数的置信区间,提供对真实参数值可能范围的估计bᵢ±tα/2,n-p-1×SEbᵢ其中tα/2,n-p-1是自由度为n-p-1的t分布的临界值,n是样本量,p是自变量数量在解释回归系数检验结果时,不仅要关注统计显著性p值,还要考虑效应大小和实际意义在多元回归中,一个变量的统计显著性取决于模型中包含的其他变量,因此结果的解释应在特定模型背景下进行决定系数()R²定义与计算解释调整R²决定系数R²衡量回归模型解释因变量变异的比例R²取值范围为0到1,值越接近1表示模型解释力越强普通R²会随自变量数量增加而增大即使添加的变量例如,R²=
0.65表示模型解释了因变量65%的变异无实际意义调整R²通过惩罚自变量数量来修正这R²=SSR/SST=1-SSE/SST在简单线性回归中,R²等于相关系数r的平方一问题其中SSR是回归平方和,SST是总平方和,SSE是误调整R²=1-[1-R²n-1/n-p-1]差平方和其中n是样本量,p是自变量数量当比较不同自变量数量的模型时,应使用调整R²R²是评估回归模型拟合优度的重要指标,但它有一定局限性高R²不一定意味着模型适合预测或存在因果关系;低R²也不一定意味着自变量与因变量无关系,尤其是在预测人类行为等复杂现象时此外,不同研究领域对好的R²值标准不同,社会科学研究中R²=
0.2可能已经相当不错,而物理科学中可能需要R²
0.9回归分析的应用条件线性关系误差项假设自变量与因变量之间应存在线性关系可以通过散点图或偏回归回归分析对误差项有以下假设图检查,如果关系不是线性的,可以考虑变量转换或添加非线性独立性误差项应相互独立,尤其是时间序列数据需要检查•项如平方项自相关性无多重共线性正态分布误差项应近似服从正态分布,可通过直方图或正•态概率图检查自变量之间不应存在高度相关性多重共线性会导致回归系数估等方差性误差项方差应在各自变量水平上保持一致,可通计不稳定、标准误增大可以通过检查相关矩阵、计算方差膨胀•过残差图检查因子或容忍度来诊断一般认为表示存在严重多重VIF VIF10共线性问题零均值误差项的期望值应为零,这通常由模型设定保证•回归分析还假设数据中没有高影响点或离群值,或者它们已被适当处理可以计算距离、杠杆值或等统计量来识别影响Cook DFBeta观测此外,回归分析假设模型被正确指定,包含所有相关变量且形式正确遗漏重要变量可能导致系数估计偏差回归分析的步骤问题界定与变量选择明确研究问题,确定因变量和潜在自变量基于理论和先前研究选择相关变量,考虑可能的控制变量和交互效应数据准备与探索检查并处理缺失值、异常值进行描述性统计分析,绘制散点图和相关矩阵,检查变量分布和相互关系必要时进行数据转换如对数转换使关系更接近线性模型建立与估计选择合适的回归类型,确定变量进入模型的方式如强制录入、逐步回归使用最小二乘法或其他方法估计回归参数,获得回归方程模型评估与诊断评估整体模型拟合度F检验、R²检验个别回归系数的显著性t检验计算置信区间进行残差分析检验模型假设正态性、独立性、等方差性检查多重共线性和影响点模型解释与应用解释回归系数的实质意义,评估各自变量的相对重要性使用模型进行预测,计算新观测值的预测区间结合研究背景讨论结果的理论和实践意义回归分析是一个迭代过程,可能需要多次调整模型以获得最佳结果在报告回归分析时,应清晰描述研究问题、数据特征、模型假设检验结果及最终模型的参数估计和解释回归分析结果的解释整体模型解释回归系数解释首先报告整体模型的显著性和解释力对每个显著的回归系数进行实质性解释检验结果表明模型是否显著优于零模型例如回归模型整体非标准化系数表示自变量每变化一个单位,因变量的平均变FB显著化量例如工资每增加元,满意度平均增加分F3,96=
28.74,p
0.
00110000.32B=
0.32,p=
0.003和调整表明模型解释因变量变异的比例例如模型解释R²R²了员工满意度的变异调整标准化系数表示自变量每变化一个标准差,因变量变化的
45.2%R²=
0.452,R²=
0.435Beta标准差数可用于比较不同单位自变量的相对重要性还可以报告模型的标准误,作为预测精度的指标解释时应强调控制其他变量后的条件性在解释回归结果时,也应注意模型的局限性和可能的问题例如,指出可能存在的遗漏变量偏差、多重共线性问题或样本代表性限制此外,应区分统计显著性和实际意义,一个效应可能统计显著但实际影响很小,或者统计不显著但可能有实际意义最后,将回归结果与研究问题和理论框架联系起来,探讨结果对理论发展和实践应用的启示,并提出未来研究方向第七章卡方检验独立性检验齐性检验检验两个分类变量是否相互独立检验不同群体的分布是否相同拟合优度检验McNemar检验检验观察频数是否符合理论分布用于配对名义数据的前后比较2314卡方检验是一类用于分析分类数据名义变量或顺序变量的非参数方法,它不要求数据服从正态分布,因此应用范围广泛卡方检验通过比较观察频数与期望频数之间的差异,检验分类变量之间是否存在显著关联或分布是否符合预期模式本章将详细介绍卡方检验的基本原理、主要类型、应用条件以及结果解释,重点讨论拟合优度检验和独立性检验这两种最常用的形式掌握卡方检验对于分析问卷调查、市场研究、医学临床试验等领域的分类数据尤为重要拟合优度检验基本概念检验原理与计算拟合优度检验用于检验一组观察频数是否原假设₀观察频数分布与期望频数分布一致Goodness-of-fit testH:与理论上预期的频数分布相符合它回答的问题是实际观察备择假设₁观察频数分布与期望频数分布不一致H:到的分布是否与特定理论分布显著不同?检验统计量χ²=Σ[O-E²/E]应用场景包括其中是观察频数,是期望频数,求和范围是所有类别O E检验数据是否服从均匀分布如骰子是否公平••检验数据是否符合预先设定的理论比例自由度df=k-1-m,其中k是类别数,m是从数据估计的参数数量检验样本是否代表总体与已知总体分布比较•当值大且值小于显著性水平时,我们拒绝原假设,认为观察分布与期望分布存在显著差异反之,如果值小且值大于,则不χ²pαχ²pα能拒绝原假设,认为数据与理论分布相符拟合优度检验要求每个类别的期望频数不能太小,通常建议所有期望频数都应大于如果某些类别的期望频数较小,可以考虑合并相5邻类别以满足这一要求独立性检验基本概念检验原理与计算独立性检验Test ofindependence用于检验两个分原假设H₀:两个变量相互独立类变量之间是否存在统计关联它回答的问题是备择假设H₁:两个变量不独立存在关联两个变量的分类是否相互独立?数据通常以列联表contingency table形式呈现,行应用场景包括表示一个变量的类别,列表示另一个变量的类别•检验性别与政治观点是否相关•检验教育程度与收入水平是否有关联期望频数计算E_ij=行总和_i×列总和_j/总样•检验治疗方法与康复结果是否相关本量检验统计量χ²=Σ[O_ij-E_ij²/E_ij]自由度df=r-1c-1,其中r是行数,c是列数效应大小除了显著性检验,还应评估关联强度常用指标包括•Phi系数φ适用于2×2列联表•Cramers V适用于任何大小的列联表•列联系数C值永远小于1,受表大小影响卡方独立性检验要求期望频数不能太小,一般建议所有期望频数都应大于5,且不超过20%的单元格期望频数小于5对于小样本或稀疏表,可以使用Fisher精确检验作为替代卡方分布χ²df分布定义自由度参数卡方χ²分布是由k个独立标准正态随机变量的平方和卡方分布的形状由自由度df决定,对应于独立正态所组成的概率分布变量的数量3主要特性卡方分布是非负的、右偏的、均值等于自由度的概率分布卡方分布是一种重要的理论概率分布,是许多统计检验的基础,尤其是用于分类数据分析的卡方检验它的特点包括只取非负值;是右偏分布,随着自由度增加逐渐趋于对称;均值等于自由度,方差等于自由度的两倍在卡方检验中,我们计算检验统计量并与卡方分布的临界值比较,或者计算p值并与显著性水平比较当自由度较大时通常df30,卡方分布可以近似为正态分布卡方检验的基本思想是将观察值与期望值之间的差异标准化,并将这些标准化差异的平方和与相应自由度的卡方分布进行比较如果这个和超过了临界值,则认为差异显著,拒绝原假设卡方检验的应用条件随机抽样期望频数要求数据应来自随机样本,观测应相互独立样本的选择不应偏向特定群体或传统建议要求所有单元格的期望频数都大于5现代观点较为宽松,认为结果这是所有统计检验共有的基本假设不超过20%的单元格期望频数可以小于5,但任何单元格的期望频数都不应小于1分类数据观测独立性卡方检验适用于分类变量名义或顺序数据应表示为频数或计数,而非每个观测应只被计入一个单元格,即一个对象不能同时属于多个类别对连续测量值如果原始数据是连续的,需要先将其分类后才能应用卡方检于重复测量或配对设计,应使用McNemar检验等专门方法,而非标准卡验方检验当数据不满足卡方检验的应用条件时,可以考虑以下替代方法对于小样本或稀疏表,可使用Fisher精确检验;对于2×2列联表,可使用Yates连续性校正;对于顺序变量,可以考虑Cochran-Armitage趋势检验;对于配对设计,应使用McNemar检验卡方检验的步骤设立假设1明确原假设H₀和备择假设H₁对于拟合优度检验,H₀是观察频数分布与期望频数分布一致;对于独立性检验,H₀是两个变量相互独立整理数据将数据整理成适当的形式对于拟合优度检验,列出各类别的观察频数和期望频数;对于独立性检验,构建列联表,计算各单元格的观察频数和期检查应用条件望频数验证数据是否满足卡方检验的应用条件,特别是期望频数要求如不满足,考虑合并类别或使用替代方法计算卡方值使用公式χ²=Σ[O-E²/E]计算卡方统计量确定相应的自由度拟合优度检验为df=k-1-m,独立性检验为df=r-1c-1做出决策根据计算得到的卡方值和自由度,确定p值并与预设的显著性水平α比较如果p≤α,则拒绝原假设;如果pα,则不能拒绝原假设解释结果对检验结果进行实质性解释对于显著的独立性检验,分析单元格的贡献率或标准化残差,确定哪些类别组合造成了关联计算效应大小如Cramers V评估关联强度在实际应用中,可以使用统计软件如SPSS、R或Excel进行卡方检验,这些工具可以自动完成期望频数计算、卡方值计算和p值确定等步骤卡方检验结果的解释显著性结果解释非显著性结果解释效应大小评估当p≤α时,结果具有统计显著性当pα时,结果不具有统计显除了显著性,还应报告效应大,我们拒绝原假设对于拟合著性,我们不能拒绝原假设小,评估关联的实际强度常优度检验,这表明观察分布与这表明没有足够证据证明观察用指标包括期望分布显著不同;对于独立分布与期望分布不同,或两个•对于2×2表Phi系数φ性检验,这表明两个变量存在变量有关联•对于较大的表Cramers统计关联例如卡方检验结果显示,教V或列联系数C例如卡方检验结果显示,性育水平与政治立场之间没有显效应大小的解释标准因领域而别与职业选择存在显著关联著关联χ²6=
10.54,p=
0.104异,一般而言,Cramers Vχ²3=
15.67,p=
0.
0010.1为弱关联,
0.1-
0.3为中等关联,
0.3为强关联对于显著的独立性检验,还应分析哪些单元格对卡方值贡献最大,即哪些类别组合特别频繁或稀少这可以通过计算调整后的标准化残差adjusted standardizedresiduals来实现,绝对值大于
1.96的残差表明该单元格在α=
0.05水平上显著不同于期望最后,应将统计结果与研究问题和实际背景结合起来进行实质性解释,讨论可能的原因和影响,并提出进一步研究的方向第八章非参数检验无分布假设不需要假设数据服从特定分布基于排序通常使用数据的秩次而非原始值应用灵活适用于各种尺度的数据稳健性强对异常值不敏感非参数检验是一类不要求数据服从特定分布如正态分布的统计方法,特别适用于样本量小、数据为顺序或名义尺度、或不满足参数检验假设的情况非参数检验通常使用数据的秩次排序而非原始数值,因此也称为分布自由方法或排序统计方法本章将介绍几种常用的非参数检验方法,包括Mann-Whitney U检验独立样本、Wilcoxon符号秩检验配对样本和Kruskal-Wallis H检验三个或更多独立样本我们将讨论这些方法的基本原理、应用场景、计算步骤以及结果解释,帮助您在参数检验不适用时选择合适的替代方法检验Mann-Whitney U基本概念检验原理与计算检验也称为秩和检验是检验的非参基本步骤包括Mann-Whitney UWilcoxont数替代方法,用于比较两个独立样本的分布是否有显著差异它将两组数据合并,并按照大小排序赋予秩次
1.不比较均值,而是比较两组的位置参数如中位数计算每组的秩和₁和₂
2.R R应用场景包括计算统计量₁₁₂₁₁₁
3.U U=n n+n n+1/2-R•样本量小且不满足正态分布假设
4.U₂=n₁n₂-U₁•数据为顺序尺度或连续但分布偏斜
5.取U=minU₁,U₂作为检验统计量存在异常值且不希望它们过度影响结果•小样本时使用的临界值表,大样本时近似服从正态分布,可U U转换为统计量z检验的原假设₀是两组样本来自相同分布或中位数相等,备择假设₁是分布不同双侧或一组的值倾向于大于小Mann-Whitney UH H/于另一组单侧当计算得到的值小于临界值或对应的值小于显著性水平时,我们拒绝原假设,认为两组分布存在显著差异U pα符号秩检验Wilcoxon计算配对差值首先计算每对观测值的差值d_i=X_i-Y_i,X_i和Y_i是第i对观测的两个测量值排除零差值去除差值为零的配对这些配对不提供方向性信息,记录剩余的非零差值对数n对差值绝对值排序对所有非零差值的绝对值|d_i|从小到大排序,赋予秩次如果有并列秩,则取平均秩次计算带符号秩和为每个秩次附加原始差值的正负号,然后分别计算正秩和W⁺和负秩和W⁻确定检验统计量检验统计量W取为W⁺和W⁻中的较小值小样本时使用临界值表,大样本时W近似服从正态分布Wilcoxon符号秩检验是配对样本t检验的非参数替代方法,用于比较同一组受试者在两种条件下或前后测量的差异它考虑了差值的方向正或负和大小顺序,但不要求差值服从正态分布该检验的原假设H₀是配对差值的中位数为零,备择假设H₁是中位数不为零双侧或大于/小于零单侧当W小于临界值或p值小于显著性水平α时,我们拒绝原假设,认为两种条件下存在显著差异检验Kruskal-Wallis H基本概念检验原理与计算事后检验Kruskal-Wallis H检验是单因素方差分析ANOVA的基本步骤包括当Kruskal-Wallis检验结果显著时,需要进行事后检验非参数替代方法,用于比较三个或更多独立样本的分以确定具体哪些组之间存在显著差异常用的方法包
1.将所有组的数据合并,按大小排序并赋予秩次布是否有显著差异它是Mann-Whitney U检验在多括
2.计算每组的秩和R_i和平均秩次r_i=R_i/n_i组情况下的扩展•Dunns多重比较专为Kruskal-Wallis检验后的
3.计算H统计量H=[12/NN+1]×Σ[n_ir_i-r²]应用场景与ANOVA类似,但特别适用于以下情况配对比较设计
4.其中N是总样本量,n_i是第i组的样本量,r是所•数据不满足正态分布或等方差假设•成对Mann-Whitney U检验加上Bonferroni校正有数据的平均秩次控制总体第一类错误率•样本量小或分布偏斜当样本量较大时,H近似服从自由度为k-1的卡方分布•数据为顺序尺度,其中k是组数Kruskal-Wallis检验的原假设H₀是所有组的分布相同,备择假设H₁是至少有两组分布不同当H值大且p值小于显著性水平α时,我们拒绝原假设,认为组间存在显著差异,然后进行事后检验确定具体哪些组之间存在差异非参数检验的应用场景小样本研究顺序数据当样本量较小通常n30时,很难验证数据是否当数据为顺序尺度如李克特量表、等级评分时2满足正态分布假设,此时非参数方法更为可靠,参数检验的均值比较可能不适合,而基于秩次的非参数方法更为合适存在异常值非正态分布当数据中存在极端值且这些值是正常观测而非错当数据明显不符合正态分布如严重偏斜或多峰43误时,基于秩次的非参数方法不会受到异常值的分布时,即使样本量较大,非参数方法也可能过度影响更为稳健非参数检验通常与参数检验构成配对关系,可作为对应参数方法的替代选择常见的配对包括单样本Wilcoxon符号秩检验代替单样本t检验;Mann-Whitney U检验代替独立样本t检验;Wilcoxon符号秩检验代替配对样本t检验;Kruskal-Wallis H检验代替单因素方差分析;Friedman检验代替重复测量方差分析虽然非参数检验具有适用范围广、假设少的优势,但也有一定局限性当数据确实满足参数检验假设时,非参数方法的统计功效检测真实效应的能力通常低于对应的参数方法此外,非参数检验的结果解释有时不如参数检验直观,例如它们通常比较分布位置而非具体均值差异第九章统计软件应用数据导入与准备描述性统计分析推断统计检验学习如何将不同格式的数据如Excel使用SPSS的描述性统计功能计算均掌握各种统计检验在SPSS中的操作、CSV导入SPSS,设置变量属性名值、标准差、中位数、四分位数等,步骤,包括t检验、方差分析、相关分称、类型、测量尺度,处理缺失值,创建频数表,生成直方图、箱线图、析、回归分析、卡方检验和非参数检创建新变量和重编码散点图等可视化图表验,学习如何设置参数和解读输出结果结果报告与输出了解SPSS输出查看器的使用,如何编辑表格和图表,导出结果到Word、Excel或PDF,以及如何撰写符合学术标准的统计分析报告统计软件是现代数据分析不可或缺的工具,大大简化了复杂统计计算的过程本章以SPSSStatistical Packagefor theSocialSciences为例,介绍统计软件在差异显著性检验中的应用SPSS是社会科学和医学研究中最常用的统计软件之一,具有用户友好的图形界面和全面的分析功能除了SPSS,其他常用的统计软件还包括R免费开源,功能强大但学习曲线较陡、SAS企业级数据分析解决方案、Stata经济学和生物统计学常用以及Python的统计库如pandas,scipy,statsmodels掌握至少一种统计软件对于实际研究工作至关重要结语差异显著性检验在科研中的重要性科学决策的基础提供客观依据,避免主观判断偏差研究有效性的保障确保研究结论建立在可靠统计分析之上知识积累的方法通过严谨的统计检验累积科学证据差异显著性检验作为科学研究方法的核心工具,在各个学科领域都发挥着至关重要的作用它为研究者提供了一套系统的方法来判断观察到的差异是否仅仅由抽样误差造成,还是反映了真实的效应通过本课程的学习,您已经掌握了从基础的t检验到高级的方差分析、从参数检验到非参数检验等多种统计方法,能够根据研究问题和数据特点选择合适的分析策略需要强调的是,统计显著性只是科学推断的一个方面,而非全部p值小于
0.05并不自动意味着发现具有重要的科学或实践意义,同样,p值大于
0.05也不意味着没有效应存在完整的统计分析应该结合效应大小、置信区间、研究设计质量和理论背景等多方面因素科学研究需要的是批判性思维和谨慎的方法论,而非机械地追求显著性。
个人认证
优秀文档
获得点赞 0