还剩28页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
卡方检验教学大赛课件什么是卡方检验?卡方检验是一种非参数假设检验方法,主要用于分析分类数据它通过比较观察频数与理论频数的吻合程度,来判断变量之间是否存在显著关联卡方检验是分析分类变量之间关系的强大工具,能够帮助研究者确定不同类别的分布是否符合预期•两个或多个分类变量是否相互独立•卡方检验的历史背景年11900英国著名统计学家首次提出卡方检验方法,奠定Karl Pearson了现代统计学的重要基础因此,卡方检验也被称为卡Pearson方检验2世纪早期20随着统计学的发展,卡方检验被不断完善和扩展,形成了多种类型的卡方检验方法现代应用3如今,卡方检验已广泛应用于医学研究、社会科学、市场调研、质量控制等众多领域,成为分析分类数据的标准工具卡方检验的基本思想零假设₀统计量显著性判断Hχ²观察频数与期望频数无显著差异,即变量之计算观察频数与期望频数之间偏离程度的量根据自由度和分布计算值,当时,χ²P Pα间相互独立或分布符合预期化指标,偏离越大,值越大拒绝零假设,认为差异具有统计学意义χ²卡方检验的核心在于比较实际观察到的频数与理论上期望的频数之间的差异如果差异足够大,则表明观察数据与理论模型不符,需要拒绝零假设卡方分布曲线示意图卡方分布是一种非对称分布,其形状取决于自由度随着自由度增加,分布曲线逐渐变得对称,并接近正态分布df卡方分布特点临界值的含义总是非负值()•χ²≥0右偏分布,尤其是自由度较小时•期望值等于自由度•统计量计算公式χ²公式解释统计学意义是卡方统计量统计量衡量观察值与理论值之间的偏离程度每个类别的偏离量经过•χ²χ²标准化处理(除以期望频数),然后求和得到总体偏离量是第类的观察频数•Oi i是第类的期望频数•Ei i是类别总数•n计算步骤详解确定观察频数与期望频数观察频数是实际调查或实验得到的各类别频数;期望频数是根据零假设计算的理论频数计算残差残差观察频数期望频数,表示实际观察值偏离理论值的程度=-标准化处理将残差平方后除以期望频数,进行标准化处理,消除频数大小差异的影响求和得到值χ²将所有类别的标准化残差求和,得到最终的统计量χ²自由度与显著性水平自由度计算df拟合优度检验类别数•df=-1独立性检验行数×列数•df=-1-1显著性水平α常用的显著性水平为,表示我们允许的概率错误地拒绝零假设
0.055%判断标准当值时,拒绝零假设,认为差异具有统计学意义Pα样本量与期望频数要求期望频数基本要求不满足要求时的处理方法每个单元格的期望频数应不小于,且以上的单元格期望频数应当样本量较小或期望频数较低时,可采用以下替代方法180%不小于5合并类别,增加每个单元格的期望频数•采用连续性校正(校正)•Yates使用精确检验替代卡方检验•Fisher拟合优度检验()Goodness-of-Fit拟合优度检验用于检验单一分类变量的观察分布是否符合预期的理论分布应用场景检验随机事件是否服从特定分布•验证样本是否代表总体•测试理论模型的适合程度•零假设₀H观察频数分布与期望频数分布无显著差异独立性检验()Independence Test独立性检验用于判断两个分类变量之间是否存在关联应用场景分析风险因素与疾病的关联•研究消费者特征与购买行为的关系•考察教育水平与职业选择的相关性•零假设₀H两个分类变量相互独立,没有关联同质性检验()Homogeneity Test同质性检验用于比较多个样本在同一分类变量上的分布是否一致应用场景零假设₀H比较不同地区消费者的品牌偏好多个样本具有相同的分布特征,即在•给定分类变量上表现出同质性分析不同年龄组对政策的支持程•度考察不同治疗方法的疗效分布•与独立性检验的区别四格表与列联表检验四格表(×列联表)22用于分析两个二分类变量之间的关系,是最简单的列联表形式自由度×df=2-12-1=1多维列联表用于分析有两个以上分类的变量之间的关系自由度行数×列数df=-1-1列联表检验的本质是分析各单元格的观察频数与期望频数之间的差异期望频数计算基于行列边际和,假设两个变量相互独立实例掷骰子适合度检验1假设我们掷一个骰子次,观察各点数出现的频率,检验骰子是否公平120计算值χ²判断结果观察频数期望频数自由度df=6-1=5时的临界值为α=
0.
0511.07实例网页偏好独立性检验2调查名用户对新版和旧版网页的偏好,检验用户是否显著偏好某一版本60A B零假设₀H用户对两个版本的偏好无显著差异,即期望比例为1:1计算值χ²期望频数₁₂÷E=E=602=30判断结果自由度df=2-1=1新版旧版A B计算得值P
0.001实例吸烟与呼吸道疾病关联性3研究吸烟习惯与呼吸道疾病的关联性,收集了以下数据有呼吸道疾病无呼吸道疾病总计吸烟者6535100非吸烟者2575100总计90110200计算期望频数计算值χ²吸烟疾病×÷+10090200=45吸烟无疾病×÷+100110200=55非吸烟疾病×÷+10090200=45判断结果非吸烟无疾病×÷+100110200=55自由度×df=2-12-1=1值P
0.0001与语言中的卡方检验Excel R中实现卡方检验语言中实现卡方检验Excel R=CHITEST实际区域,期望区域#拟合优度检验observed-计算P值=CHIINVα,df计算临c25,17,15,23,24,16chisq.tes界值tobserved,p=rep1/6,6#独立性检验matrix_data-matrixc65,35,25,75,中可以通过数据分析工具包中的卡nrow=2,Excel方检验功能进行快速分析,也可以手动byrow=TRUEchisq.testmatrix_计算值和值dataχ²P示例对于前面的网页偏好数据,在中可以使用Excel=CHITEST{14,46},{30,30}结果
0.0000362卡方检验的局限性样本量限制仅适用于分类数据当样本量较小时,卡方检验的准确性会受到影响一般建议总样本量卡方检验只适用于分类变量或已分组的连续变量,不适合直接分析连不少于,且每个单元格的期望频数满足基本要求续变量之间的关系连续变量分析应考虑相关分析、回归分析等方法30无法分析复杂关系受分类方式影响卡方检验只能反映变量之间是否存在关联,但无法说明关联的方向、连续变量分组方式的不同可能导致卡方检验结果的差异研究者应基强度和具体形式复杂关系分析需要结合其他统计方法于理论或实际意义选择合理的分类标准连续性校正与精确检验Fisher连续性校正(校正)Yates适用于2×2列联表且样本量较小时,减小χ²值偏差连续性校正通过从残差的绝对值中减去
0.5,使离散分布更接近连续分布,减少第一类错误率精确检验Fisher适用于样本量极小或期望频数极低的情况,直接计算概率Fisher检验不依赖于卡方分布的近似,而是精确计算概率,特别适合小样本研究多重比较与卡方检验当进行多组卡方检验比较时,需要注意多重比较问题,即随着检验次数增加,第一类错误率累积增大的问题多重比较问题校正其他校正方法Bonferroni假设显著性水平,进行次独立最常用的校正方法,将显著性水平除以比较方法逐步调整显著性水平α=
0.0520•Holm检验,至少有一次错误拒绝零假设的概率高次数校正控制错误发现率•FDR达64%多维列联表分析一次性分析多个分类•变量例如进行组两两比较(共次),则调33整后÷α=
0.053=
0.0167卡方检验结果的科学报告格式标准报告格式结果解释的关键要素在学术论文和研究报告中,卡方检清晰说明研究假设和零假设•验结果通常按以下格式报告报告自由度、样本量和统计量•提供精确值或值范围值值•p pχ²df,N=,p=说明是否进行了校正(如连续性校正)•例如χ²1,N=60=
17.07,p解释结果的实际意义,而非仅关注统计显•
0.001著性对于不显著的结果,精确报告值pχ²5,N=120=
5.9,p=
0.317卡方检验在科研中的应用案例医学研究市场调研分析不同治疗方法的疗效差异、诊断方分析消费者偏好、市场细分、品牌忠诚法的一致性评价、疾病风险因素的识别度等市场特征案例不同年龄组消费者对新产品接受案例比较两种药物治疗后患者症状改程度的比较,χ²3,N=450=善情况的差异,,表明年龄与产χ²1,N=187=
12.63,p=
0.006,表明两种药物疗品接受度相关
8.54,p=
0.003效存在显著差异社会学研究研究人口特征与社会态度、行为模式之间的关系案例教育水平与环保意识的关联分析,,χ²4,N=1205=
27.89,p
0.001表明教育水平与环保意识显著相关课堂小结卡方检验的核心内容实际应用要点卡方检验是分析分类数据的重要非参合理设计研究,确保样本具有代表性••数方法注意样本量和期望频数的要求•通过比较观察频数与期望频数来判断•根据研究问题选择合适的卡方检验类•变量关系型计算统计量,并根据自由度和显著•χ²正确解释检验结果,不仅关注值,•p性水平做出判断还要考虑实际意义主要包括拟合优度检验、独立性检验•熟练使用统计软件进行数据分析•和同质性检验互动环节1现场演练卡方计算提供一组数据,让学生现场计算值和值,加深对计算过程的理解χ²p数据示例某调查中,名受访者中有人支持方案,人支持方案200120A80B检验受访者对两个方案的支持是否有显著差异2分组讨论案例设计将学生分为若干小组,每组设计一个应用卡方检验的研究案例,包括研究问题与假设•数据收集方法•卡方检验类型选择及理由•可能的结果解释•解答学生疑问谢谢聆听!期待你的精彩表现祝教学大赛成功欢迎课后交流与探讨希望本次卡方检验教学课件能够帮助您如有任何关于卡方检验教学的问题或建在教学大赛中取得优异成绩!展示您独议,欢迎随时交流探讨,共同提高统计特的教学风格和专业水平学教学水平。
个人认证
优秀文档
获得点赞 0