还剩27页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
概率的基本性质概率论的基本概念随机现象样本空间事件是指在一定条件下,其结果不确定的现是指随机现象所有可能结果的集合是指样本空间的子集,即随机现象的某象个结果或多个结果基本概念回顾样本空间事件所有可能结果的集合样本空间的子集概率事件发生的可能性概率的定义事件发生的可能性0到1之间的数值概率反映事件发生的可能性大小,用数值表示概率值介于0和1之间,分别代表事件不可能发生和必然发生概率的性质非负性规范性可加性123任何事件的概率都大于或等于0样本空间中所有事件的概率之和等互斥事件的概率等于各个事件概率于1之和概率的加法公式互斥事件如果两个事件不能同时发生,它们被称为互斥事件公式对于互斥事件A和B,其概率的加法公式为PA或B=PA+PB示例掷骰子时,得到1点或6点的概率是P1+P6=1/6+1/6=1/3条件概率在事件B已经发生的条件下,事件A发生的概率称为事件A在事件B发生的条件下的条件概率条件概率表示了事件B发生后,事件A发生的可能性大小,反映了事件之间的依赖关系条件概率的计算公式PA|B=PAB/PB,其中PAB表示事件A和B同时发生的概率乘法公式联合概率1事件A和事件B同时发生的概率,记为PA∩B条件概率2在事件B发生的条件下,事件A发生的概率,记为PA|B乘法公式3PA∩B=PB*PA|B或PA∩B=PA*PB|A全概率公式事件分解公式推导将一个事件分解成若干个互斥的子事件利用加法公式,推导出全概率公式贝叶斯公式先验概率似然度后验概率事件发生的初始概率新证据出现后,事件发生的概率结合新证据,更新后的事件概率独立事件互不影响概率相乘两个事件相互独立意味着一个独立事件同时发生的概率等于事件的发生不会影响另一个事它们各自概率的乘积件发生的概率典型例子抛硬币两次,第一次正面朝上并不影响第二次正面朝上的概率独立事件的概率PA∩B=PA*PB PA|B=PA两个事件A和B独立,则事件A发事件B的发生不影响事件A发生的生的概率和事件B发生的概率相概率,即事件A发生的概率和事乘等于事件A和B同时发生的概率件B发生与否无关例子抛硬币抛一枚硬币两次,两次抛掷的结果相互独立第一次抛掷正面,第二次抛掷正面的概率是1/2*1/2=1/4正态分布正态分布是一种非常常见的概率分布,也称为高斯分布它在自然界和社会科学中广泛存在正态分布的图形呈钟形,对称,曲线两端逐渐下降它由均值和标准差两个参数决定正态分布的特点对称性峰度均值、中位数和众数相等正态分布曲线关于均值对称,这意味着正态分布曲线呈现钟形,在均值处达到在正态分布中,均值、中位数和众数都曲线两侧的形状完全相同这意味着数峰值,然后逐渐下降峰度是指曲线峰位于分布的中心,即钟形曲线的峰值据分布在均值周围对称值的尖锐程度正态分布的峰度为3标准正态分布均值为0方差为1标准正态分布的平均值为0标准正态分布的标准差为1正态分布的应用数据分析和统计推断过程控制和质量管理科学研究和实验设计金融建模和风险管理频率与概率频率概率频率是指一个事件在大量重复概率是指一个事件发生的可能试验中出现的次数占总试验次性大小,通常用0到1之间的数数的比例字表示频率直方图频率直方图是用来表示数据分布情况的图形,横轴表示数据分组,纵轴表示各组的频率,将各组的频率用直方柱表示出来,形成的图形就是频率直方图频率直方图可以直观地展示数据的集中趋势、离散程度和分布形状,方便我们对数据的特征进行分析频率多边形频率多边形是用线段连接频率直方图各矩形中点,并在两端与横轴相交而形成的折线图频率多边形可以更直观地显示数据分布的趋势,并能更好地反映数据变化的趋势累积频率分布累积频率分布是一种用于描述数据分布的图形方法它显示了在某个特定值或以下的值的数量,占总数据量的百分比累积频率分布可以用来识别数据的集中趋势、分散程度和异常值抽样分布样本统计量的分布样本均值的分布抽样分布描述了样本统计量在所有可能的样本中取值的概率分布例如,样本均值的抽样分布描述了所有可能的样本均值在不同样本中出现的概率抽样分布的性质中心极限定理样本方差当样本量足够大时,样本均值的样本方差的分布也接近正态分布分布近似于正态分布,无论总体,尤其是在样本量较大时分布是什么样本比例当总体比例已知时,样本比例的分布也是正态分布点估计样本均值样本比例样本方差使用样本均值来估计总体均值使用样本比例来估计总体比例使用样本方差来估计总体方差点估计的性质无偏性有效性一致性估计量的期望值等于被估计参数的真值估计量在所有无偏估计量中方差最小随着样本量的增加,估计量越来越接近无偏性意味着估计量在多次重复抽样有效性意味着估计量更精确,离散程度被估计参数的真值一致性意味着估计中,平均而言不会偏离真值更小,更接近真值量在样本量足够大时,能够精确地估计参数区间估计点估计区间估计置信水平单个样本统计量估计总体参数估计总体参数的置信区间置信区间包含总体参数的概率假设检验问题方法结果123用样本数据来检验关于总体的假设通过样本数据计算检验统计量,判根据检验结果,决定是否拒绝原假是否成立断其是否支持原假设设,并得出结论显著性水平显著性水平是指我们愿意接受错误拒绝原假设的风险通常用α表示,取值为
0.05或
0.01,分别代表5%或1%的错误率α值越小,拒绝原假设的难度越大,即更难找到支持备择假设的证据检验统计量计算分布P值根据样本数据和原假设计算检验统计量,了解检验统计量的分布,例如t分布、标根据检验统计量的值和分布计算p值,表例如t统计量、z统计量或F统计量准正态分布或F分布示在原假设成立的情况下观察到样本数据的概率结论通过假设检验,我们可以对总体参数做出推断,并对研究问题进行决策假设检验是统计学中重要的工具,在很多领域得到广泛应用。
个人认证
优秀文档
获得点赞 0