还剩28页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
概率复习章节本节课我们将回顾概率论的基本概念和重要定理,为后续课程学习奠定基础概念回顾概率随机变量事件发生的可能性,用到之间一个数值,其值取决于随机事件01的数字表示的结果期望方差随机变量所有可能值的平均值,随机变量与其期望值的偏差的平代表了随机变量的中心位置方,反映了随机变量的离散程度概率的定义概率是描述事件发生的可能性大小的概率通常用到之间的数值表示,010度量表示事件不可能发生,表示事件必然1发生概率可以用于分析随机现象,预测事件发生的可能性概率的计算基本公式1事件发生的概率等于事件所包含的基本事件数除以样本空间的基本事件总数加法公式2互斥事件发生的概率等于各个事件发生的概率之和乘法公式3独立事件同时发生的概率等于各个事件发生的概率之积概率的计算是概率论的基础掌握概率的计算方法,是理解和运用概率理论的关键计算概率时,要根据具体情况选择合适的公式和方法概率的性质非负性规范性12任何事件的概率都大于或等于样本空间中所有事件的概率之和等于01可加性3互斥事件的概率等于这些事件概率之和随机变量定义例子随机变量是一个变量,其值是随机事件的结果它可以是离散的例如,掷骰子时,结果是随机变量,其取值为到的整数天16或连续的,取决于其可能的取值范围气温度也是随机变量,其取值是连续的离散随机变量有限个值可数个值应用广泛离散随机变量取值有限,比如骰子结果,只离散随机变量可以取值无穷多个,但可数,离散随机变量广泛应用于人口统计、调查分能是到比如投掷硬币,结果可以是正反面,但可数析等领域16连续随机变量定义特征例子其取值可以在一定范围内连续变化的随机概率密度函数,可以用来描述连续随机变身高、体重、温度等变量称为连续随机变量量在某个取值范围内的概率期望和方差期望方差随机变量的期望表示其所有可能取值的平均值,反映了随机变量随机变量的方差表示随机变量取值与其期望值的平均平方差,反的中心位置映了随机变量取值的分散程度期望的性质线性性质常数性质期望运算满足线性性质常数的期望等于常数本身EaX+bY Ec=c=aEX+bEY加法性质多个随机变量之和的期望等于各个随机变量期望之和EX+Y=EX+EY方差的性质非负性常数不变性12方差永远不会是负数,因为它如果每个数据点都加上一个常是数据的离散程度的度量数,方差保持不变乘数效应3如果每个数据点都乘以一个常数,方差将乘以该常数的平方正态分布正态分布是概率论中最重要、最常用的分布之一,也称为高斯分布它是一种连续型概率分布,其概率密度函数呈钟形曲线正态分布在自然科学、社会科学、工程技术等各个领域都有广泛应用,例如身高、体重、血压等生物特征,以及测量误差、产品质量等标准正态分布标准正态分布是一种特殊的正态分布,其均值为,方差为01它在统计学中具有重要地位,因为许多统计量都服从或近似服从标准正态分布标准正态分布的概率密度函数为fx=1/sqrt2π*exp-x^2/2正态分布的应用数据分析医学研究金融数据分析正态分布广泛用于数据分析,可用于描述各在医学研究中,正态分布用于分析实验结果正态分布应用于金融数据分析,例如股票价种自然现象,例如身高、体重、血压等,并、确定治疗效果和评估药物的安全性格、利率和汇率的预测用于假设检验和置信区间估计双随机变量联合分布边缘分布描述两个随机变量同时取值的概描述单个随机变量的概率分布,率分布不考虑另一个变量条件分布描述一个随机变量在另一个变量取特定值时的概率分布二元分布联合概率边缘概率表示两个随机变量同时取特定值表示单个随机变量取特定值的概的概率率,无论另一个随机变量的值如何条件概率表示在已知另一个随机变量取特定值的情况下,一个随机变量取特定值的概率边缘分布和条件分布边缘分布条件分布12边缘分布是指随机变量在某个变量的特定取值下,另一个变条件分布是指在已知一个随机变量的取值情况下,另一个随量的概率分布机变量的概率分布相关系数1-1度量完全负相关两个变量之间的线性关系强度01无相关完全正相关协方差定义衡量两个随机变量之间线性关系的程度公式CovX,Y=E[X-E[X]Y-E[Y]]正值和呈正相关,即增加时X YX Y也倾向于增加负值和呈负相关,即增加时X YX Y倾向于减少零值和不存在线性关系X Y大数定律独立同分布1前提条件样本均值收敛2核心结论样本容量增大3关键因素大数定律阐述了当样本容量足够大时,样本均值将趋近于总体均值的规律其适用范围广泛,常用于估计总体参数、风险管理和数据分析等领域中心极限定理独立随机变量1中心极限定理表明,当我们从一个总体中随机抽取多个样本时,样本均值的分布趋近于正态分布,即使原始总体本身不是正态分布样本量增加2随着样本量的增加,样本均值的分布会越来越接近正态分布实际应用3中心极限定理在统计推断中至关重要,它为我们提供了理解和分析数据的基础区间估计利用样本数据推断总体参数的范围置信区间表示总体参数的可能取值范围置信水平表示区间包含总体参数的概率置信区间样本统计量置信水平置信区间使用样本统计量来估计总体参数的范围置信水平表示我们对区间包含总体参数的确定程度假设检验定义假设根据研究问题提出零假设和备择假设收集数据收集样本数据以检验假设计算检验统计量根据样本数据计算检验统计量,用于评估假设确定值p根据检验统计量和检验假设,计算p值,表示在假设成立的情况下观察到该结果或更极端结果的概率做出决策根据p值和显著性水平做出决策,接受或拒绝零假设单样本检验检验假设1确定总体参数的假设收集样本2从总体中随机抽取样本计算检验统计量3使用样本数据计算检验统计量确定值p4根据检验统计量和假设分布计算p值做出决策5根据p值和显著性水平做出拒绝或接受假设的决策双样本检验目标1比较两个独立样本的总体均值是否相等假设2零假设两个样本的总体均值相等备择假设两个样本的总体均值不相等检验统计量3检验统计量,用于比较两个样本均值的差异t值P4值表示在零假设为真的情况下,观察到样本差异或更大P差异的概率结论5如果值小于显著性水平,则拒绝零假设,表明两个样本P的总体均值存在显著差异方差分析单因素方差分析1一个自变量对因变量的影响双因素方差分析2两个或多个自变量对因变量的影响重复测量方差分析3同一组受试者在不同时间点上的测量数据回归分析线性回归使用一条直线来描述两个变量之间的关系多元回归使用多个自变量来预测因变量逻辑回归用于预测一个二元变量的概率实践案例应用概率知识分析实际问题例如,预测股票价格走势、评估风险投资、设计抽样调查等总结与展望回顾展望本节课我们回顾了概率论的基础知识,包括概率的定义、计算、在接下来的课程中,我们将继续深入探讨概率论的相关理论,并性质以及随机变量的概念还学习了期望、方差、正态分布和双将其应用于实际问题中例如,我们会学习如何进行假设检验、随机变量等重要概念区间估计和回归分析等。
个人认证
优秀文档
获得点赞 0