还剩58页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
概率论基础复习课件欢迎参加概率论基础复习课程!本课件涵盖了概率论的基本概念、随机变量、分布函数、数字特征以及大数定律和中心极限定理等核心内容通过系统的学习,你将掌握概率论的基础理论和应用方法,为后续的数理统计和应用概率课程打下坚实基础本课件适合数学、统计学、经济学、计算机科学等专业的学生使用,也可作为工程技术人员的参考资料希望这份复习材料能够帮助你更好地理解概率论的精髓,顺利通过考试课程概述课程目标学习重点掌握概率论基本概念和定理,重点掌握随机事件及其运算、能够运用概率方法分析和解决概率的计算、随机变量及其分实际问题建立概率思维,理布、数字特征以及大数定律和解随机现象的内在规律,为进中心极限定理特别注意理解一步学习统计学和机器学习奠条件概率、全概率公式和贝叶定基础斯公式的应用考试说明考试时长为120分钟,满分100分题型包括选择题、填空题、计算题和证明题要求掌握基本概念和基本方法,能够熟练运用公式解决实际问题第一章概率论基本概念随机现象1在相同条件下重复进行的试验,其结果具有不确定性样本空间2随机试验所有可能结果构成的集合随机事件3样本空间的子集,代表试验的某种结果概率4表示随机事件发生可能性大小的数值度量概率论是研究随机现象数量规律的数学分支,是统计学的理论基础第一章将介绍概率论的基本概念,帮助我们建立对随机性的科学认识,为后续章节奠定基础随机试验定义特征随机试验是指在给定条件下可重复进•可重复性在相同条件下可以重行的,且每次试验的结果事先不能确复进行定的实验随机试验是概率论研究的•随机性结果具有不确定性对象,也是建立概率模型的基础•稳定性大量重复试验呈现出统计规律•可观察性试验结果可以被观察和记录示例•抛硬币观察正反面•掷骰子记录点数•从袋中随机抽取一个球•测量产品的使用寿命样本空间定义样本空间是随机试验中所有可能结果的集合,通常用符号Ω表示样本空间中的每个元素称为样本点,代表一个基本结果样本空间是构建概率模型的第一步构造方法分析试验的所有可能结果,列举或描述所有样本点对于复杂试验,可以通过笛卡尔积、树形图等方法构造构造样本空间时需保证完备性和互斥性常见示例抛一枚硬币Ω={正面,反面};掷一个骰子Ω={1,2,3,4,5,6};连续抛两次硬币Ω={正,正,正,反,反,正,反,反}现实问题往往有更复杂的样本空间结构随机事件定义分类表示方法随机事件是样本空间的子集,表示随机试•基本事件只含单个样本点的事件通常用大写字母A、B、C等表示事件例验可能出现的某种结果每个事件可以看如,在掷骰子试验中,可以定义事件A=•必然事件一定会发生的事件,即Ω作是由一个或多个样本点组成的集合当出现奇数点={1,3,5},事件B=点数大于•不可能事件一定不会发生的事件,试验的结果是该事件中的样本点时,称该4={5,6}事件也可以用文字描述,但在即∅事件发生运算中通常使用集合表示•复合事件由多个基本事件组成的事特别地,样本空间Ω称为必然事件;空集件∅称为不可能事件;只含一个样本点的子集称为基本事件事件的关系与运算
(一)相等如果A⊂B且B⊂A,则称事件A与事件B相等,记为A=B这意味着A与B包含完包含全相同的样本点,即A发生的充分必要条件是B发生如果事件A的每一个样本点都是事件B的样本点,则称A包含于B,或B包含A,和(并)记为A⊂B这意味着当事件A发生时,事件B一定发生事件A与事件B的和(并)是指事件A或事件B至少有一个发生,记为A∪B在集合意义上,A∪B由所有属于A或属于B的样本点组成事件之间的关系与运算借用了集合论的概念和符号,这有助于我们用数学语言精确描述随机现象掌握这些基本关系和运算是理解概率计算的基础事件的关系与运算
(二)积(交)事件A与事件B的积(交)是指事件A和事件B同时发生,记为A∩B或简写为AB在集合意义上,A∩B由同时属于A和B的所有样本点组成例如,在掷骰子试验中,若A=出现奇数点={1,3,5},B=点数大于3={4,5,6},则AB=出现大于3的奇数点={5}差事件A与事件B的差是指事件A发生但事件B不发生,记为A-B在集合意义上,A-B由属于A但不属于B的所有样本点组成继续上例,A-B=出现小于等于3的奇数点={1,3},B-A=出现大于3的偶数点={4,6}互斥事件如果事件A与事件B不能同时发生,即A∩B=∅,则称A与B互斥(或不相容)互斥事件在概率计算中具有重要性质例如,在掷骰子试验中,A=出现偶数点={2,4,6}与B=出现奇数点={1,3,5}是互斥的事件的关系与运算
(三)对立事件事件A的对立事件是指A不发生的事件,记为A̅(或Aᶜ,A)对立事件的性质A与A̅互斥且A∪A̅=Ω,有PA̅=1-PA完备事件组若事件A₁,A₂,...,Aₙ两两互斥且并集为Ω对立事件是一对特殊的互斥事件,它们的和等于必然事件例如,在掷骰子试验中,如果A=出现偶数点={2,4,6},则A̅=出现奇数点={1,3,5}完备事件组是事件空间的一个划分,即将样本空间Ω划分为若干个互不相交的子集例如,在掷骰子试验中,A₁=出现1点,A₂=出现2点,...,A₆=出现6点构成一个完备事件组完备事件组的性质在全概率公式和贝叶斯公式中有重要应用概率的定义古典概率几何概率频率概率基于等可能性原理,定义为有利样本点数与基于区域度量,定义为有利区域的测度与总基于大数定律,定义为长期稳定的相对频率总样本点数之比适用于有限样本空间且各区域测度之比适用于样本点连续分布的情适用于可重复试验例如,通过大量抛硬币样本点等可能的情况例如,掷一颗均匀骰况例如,随机点落在单位圆内指定区域的实验,正面朝上的相对频率接近1/2,可将子出现6点的概率为1/6概率等于该区域面积与圆面积之比其视为概率此外,还有主观概率,它基于个人信念和判断来衡量不确定性,多用于个人决策和贝叶斯分析中不同的概率解释有各自的适用范围,但在数学处理上是一致的概率的公理化定义非负性规范性可列可加性123对任意事件A,有PA≥0这表明概率必然事件的概率为1,即PΩ=1这是对于两两互斥的事件序列A₁,A₂,...,有是一个非负实数,反映了事件发生可能对概率度量的标准化,确立了概率的上PA₁∪A₂∪...=PA₁+PA₂+...这反性的度量必须是非负的基本事实限,使不同事件的概率具有可比性映了概率的加法规则,是进行概率计算的基础基于这三条公理,可以推导出概率的许多重要性质,如P∅=0,PA≤1,PA∪B=PA+PB-PA∩B,PA̅=1-PA等这些性质为概率计算提供了基本工具概率的公理化定义由苏联数学家柯尔莫哥洛夫于1933年提出,它奠定了现代概率论的数学基础,使概率论成为严格的数学分支古典概型古典概型是概率论中最基本的模型,它具有以下特点样本空间中只包含有限个样本点;每个基本事件发生的可能性相同在这种情况下,事件A的概率计算公式为PA=事件A包含的基本事件数/样本空间中基本事件总数古典概型的应用广泛,包括掷骰子、抛硬币、从有限总体中随机抽取等问题解决古典概型问题时,常用到组合数学知识,如排列组合公式例如,从52张扑克牌中随机抽取5张牌得到同花顺的概率,可通过计算有利事件数与总事件数之比得到几何概型定义应用条件当随机试验的样本空间可以对应于一个区域,且落在该区域内任•样本空间对应于几何区域意位置的概率与位置无关,仅与区域的大小(即测度)有关时,•随机点落在区域内任意位置的可能性相等这种概率模型称为几何概型•事件对应于样本空间的子区域在几何概型中,事件A的概率计算公式为PA=事件A对应区域几何概型适用于涉及连续随机变量的问题,如随机点落在特定区的测度/样本空间对应区域的测度其中测度可以是长度、面积、域的概率,随机线段与特定图形相交的概率等体积等经典例题布丰投针问题将长度为L的针随机投掷到一个画有平行线的平面上,平行线间距为d(假设L≤d)求针与某条线相交的概率答案是P=2L/πd,这个问题可用于实验估计π的值条件概率PB|A PA∩B/PA条件概率公式计算方法事件A已发生条件下事件B发生的概率A、B共同发生的概率除以A发生的概率PA0适用条件条件事件的概率必须大于零条件概率是概率论中的核心概念,它描述了在已知某事件发生的情况下,另一事件发生的可能性条件概率反映了信息更新对概率评估的影响,是贝叶斯分析的基础例如,从一副扑克牌中随机抽取一张牌,已知抽到的是红牌,求抽到的是红桃A的概率设A=抽到红牌,B=抽到红桃A,则PB|A=PA∩B/PA=PB/PA=1/52/26/52=1/26乘法公式独立事件的简化多个事件的情况若事件A、B相互独立,则PAB=PAPB两个事件的情况PA₁A₂...Aₙ=独立性简化了乘法公式,使计算更为便捷若n个PAB=PAPB|A=PBPA|B PA₁PA₂|A₁PA₃|A₁A₂...PAₙ|A₁A₂...Aₙ₋₁事件相互独立,则它们同时发生的概率等于各自概这表明两个事件交集的概率等于一个事件的概率乘这是两事件乘法公式的推广,适用于计算多个事件率的乘积以在该事件已发生条件下另一事件发生的条件概率同时发生的概率乘法公式是解决复杂概率问题的重要工具例如,连续掷三次骰子,求三次都掷出6点的概率使用乘法公式,P三次都是6=P第一次是6P第二次是6|第一次是6P第三次是6|前两次都是6=1/61/61/6=1/216全概率公式贝叶斯公式定理先验概率与后验概率贝叶斯公式是条件概率的一个重要应在贝叶斯公式中,PBᵢ称为事件Bᵢ的用,它实现了已知结果推断原因的概先验概率,反映在获得新信息前对Bᵢ率计算若事件B₁,B₂,...,Bₙ构成一个概率的初始估计;PBᵢ|A称为事件Bᵢ完备事件组,且PA0,则的后验概率,反映在获知事件A发生后对Bᵢ概率的修正估计PBᵢ|A=PBᵢPA|Bᵢ/[PB₁PA|B₁+PB₂PA|B₂+...+PBₙPA|Bₙ]应用示例贝叶斯公式广泛应用于医学诊断、模式识别、垃圾邮件过滤、机器学习等领域例如,在医学诊断中,可以根据检测结果(A)计算患者患有某种疾病(Bᵢ)的概率;在垃圾邮件过滤中,可以根据邮件特征(A)推断邮件是否为垃圾邮件(Bᵢ)事件的独立性定义若PAB=PAPB,则称事件A与B相互独立判断条件当且仅当一个事件的发生不影响另一事件的概率多个事件的独立性要求任意子集的交集概率等于各自概率的乘积事件的独立性是概率论中的重要概念,它描述了事件之间没有影响或关联的情况独立性的数学定义是PAB=PAPB,这等价于PA|B=PA或PB|A=PB(当相关概率都大于0时)需要注意的是,事件的独立性与互斥性是完全不同的概念事件A与B互斥意味着它们不能同时发生,即PAB=0;而如果A与B还都是非零概率事件,则PAPB0,因此互斥的非零概率事件必定不独立直观上讲,互斥事件之间有信息,因为知道一个事件发生就能确定另一事件不发生伯努利试验定义特征应用场景伯努利试验是只有两种伯努利试验具有二值性伯努利试验在质量控制、可能结果(通常称为成(结果只有两种可能)、民意调查、流行病学等功和失败)的随机试稳定性(成功概率p保持领域有广泛应用例如,验每次试验中,成功不变)和独立性(各次在产品质量检验中,每的概率为p,失败的试验相互独立)三个基个产品是否合格可视为概率为1-p,且各次试验本特征典型的伯努利一次伯努利试验;在流的结果相互独立试验包括抛硬币、质量行病学中,某人是否感检验(合格/不合格)等染某疾病也可视为伯努利试验伯努利试验序列是概率论中最基本的随机过程之一,它是二项分布、几何分布和负二项分布的基础在n次独立重复的伯努利试验中,成功次数X服从参数为n和p的二项分布,首次成功所需的试验次数Y服从参数为p的几何分布第二章随机变量及其分布随机变量的引入将随机现象的结果数量化,便于数学处理分布函数完整描述随机变量取值规律的数学工具离散型随机变量取值为有限个或可列无限个的随机变量连续型随机变量取值在一个区间或区间并集上的随机变量本章将介绍随机变量的概念、分类及其分布特征,奠定概率论的核心内容通过随机变量这一数学工具,我们能够将复杂的随机现象转化为可以定量分析的数学问题,为应用概率论解决实际问题提供基础随机变量的概念定义随机变量是定义在样本空间Ω上的实值函数,将每个样本点ω∈Ω映射为一个实数Xω它将随机试验的结果数量化,便于进行数学分析离散型随机变量取值只有有限个或可列无限个的随机变量称为离散型随机变量例如,掷骰子的点数、家庭中孩子的数量、产品的不合格数等连续型随机变量取值在某一区间或区间并集上的随机变量称为连续型随机变量例如,产品的寿命、测量误差、等待时间等一般来说,连续型随机变量取任一特定值的概率为零随机变量是概率论的核心概念,它将随机现象的结果转化为数值,使得我们可以用数学方法分析随机现象通过研究随机变量的分布规律,我们能够预测随机现象的整体表现和统计特征,为应用提供理论依据分布函数定义性质随机变量X的分布函数Fx定义分布函数具有单调不减性、右为X取值不超过x的概率,即连续性,且满足F-∞=0,Fx=PX≤x,x∈R分布函数F+∞=1对于任意实数ab,完整地描述了随机变量的统计有PaX≤b=Fb-Fa分布规律,是研究随机变量的基本函数的跳跃点对应离散型随机工具变量的取值点离散型与连续型的区别离散型随机变量的分布函数是阶梯函数,在取值点处有跳跃;连续型随机变量的分布函数是连续函数,在除测度零集外的点处可导,导数即为概率密度函数分布函数是描述随机变量分布规律的最基本工具,它对任何类型的随机变量都适用通过分布函数,可以计算随机变量落在任意区间的概率在实际应用中,分布函数用于风险评估、可靠性分析、统计推断等诸多领域离散型随机变量的分布律X x₁x₂...xᵢ...PX=xᵢp₁p₂...pᵢ...离散型随机变量的分布律(概率质量函数)是指随机变量X取各个可能值的概率,通常表示为pxᵢ=PX=xᵢ分布律可以用表格、函数表达式或概率质量函数图来表示分布律满足两个基本条件非负性,即对所有i,有pxᵢ≥0;归一性,即Σpxᵢ=1,其中求和范围是X的所有可能取值分布律与分布函数的关系是Fx=Σpxᵢ,其中求和范围是所有满足xᵢ≤x的取值点离散型随机变量的数学期望为EX=Σxᵢpxᵢ,方差为VarX=E[X-EX²]=Σxᵢ-EX²pxᵢ=EX²-EX²这些数字特征反映了随机变量的集中趋势和离散程度连续型随机变量的密度函数定义性质如果存在非负函数fx,使得随机变量X的分布函数Fx可以表示•非负性对任意x,fx≥0为Fx=∫₍₋∞₎ˣftdt,则称X为连续型随机变量,fx称为X的概率•归一性∫₍₋∞₎⁽⁺∞⁾fxdx=1密度函数•对于连续点x,Fx=fx概率密度函数描述了随机变量取值的密集程度,虽然X在任一点•PX=a=0,即连续型随机变量取单点的概率为零处的概率为零,但通过密度函数可以计算X落在任意区间的概率•Pa≤X≤b=PaX≤b=Pa≤Xb=PaXbPa≤X≤b=∫ₐᵇfxdx概率密度函数与分布函数是描述连续型随机变量的两种等价方式,分布函数是密度函数的积分,密度函数是分布函数的导数(在连续点处)相比分布函数,密度函数更直观地显示了随机变量在不同区域的取值倾向,因此在理论分析和应用中更为常用常见离散型分布
(一)分布0-1定义分布特征若随机变量X只取0和1两个值,取1的概•数学期望EX=p率为p,取0的概率为1-p(0p1),则•方差VarX=p1-p称X服从参数为p的0-1分布(又称伯努•特征函数φₓt=1-p+pe^it利分布)•分布函数Fx=0x0,1-p分布律可以简洁地表示为PX=k=0≤x1,1x≥1p^k1-p^1-k,k=0,1这是最简单的离散型分布,对应单次伯努利试验的结果应用场景0-1分布广泛应用于描述二元结果的随机试验,如产品质量检验(合格/不合格)、投票行为(支持/反对)、医学检测(阳性/阴性)等它是二项分布的基本组成单元,n个独立的0-1分布随机变量之和服从二项分布常见离散型分布
(二)二项分布n p试验次数成功概率独立重复试验的总次数每次试验成功的概率Cn,kp^k1-p^n-k概率质量函数k次成功的概率二项分布是概率论中最重要的离散分布之一,它描述了n次独立重复的伯努利试验中成功次数的分布若随机变量X表示n次试验中成功的次数,且每次试验成功的概率为p,则X服从参数为n和p的二项分布,记为X~Bn,p二项分布的期望为EX=np,方差为VarX=np1-p当n很大时,二项分布可以用正态分布近似,特别地,当np和n1-p都大于5时,近似效果较好二项分布在质量控制、市场调查、生物学和医学研究等领域有广泛应用常见离散型分布
(三)泊松分布常见连续型分布
(一)均匀分布均匀分布是最简单的连续型分布,它描述了随机变量在给定区间内取值的概率密度处处相等的情况若随机变量X在区间[a,b]上服从均匀分布,记为X~U[a,b],其概率密度函数为fx=1/b-a,a≤x≤b;0,其他均匀分布的分布函数为Fx=0,xa;x-a/b-a,a≤x≤b;1,xb均匀分布的期望为EX=a+b/2,方差为VarX=b-a²/12均匀分布常用于描述随机数生成、舍入误差以及某些物理过程,如粒子在一定区域内随机分布的位置等常见连续型分布
(二)指数分布定义分布函数概率密度函数fx=λe^-λx,x≥0;fx=0,x0Fx=1-e^-λx,x≥0;Fx=0,x0无记忆性数字特征PXs+t|Xs=PXt期望EX=1/λ,方差VarX=1/λ²指数分布是描述等待时间或寿命的重要连续分布它与泊松过程密切相关如果事件发生服从参数为λ的泊松过程,则相邻两个事件之间的时间间隔服从参数为λ的指数分布指数分布最显著的特性是无记忆性,即对于任意s,t0,有PXs+t|Xs=PXt这意味着,如果一个元件已经使用了s小时仍在正常工作,则它再工作t小时的概率与一个全新元件工作t小时的概率相同这一特性使指数分布在可靠性理论、排队论等领域有广泛应用常见连续型分布
(三)正态分布定义正态分布(或高斯分布)是最重要的连续型分布,其概率密度函数为fx=1/√2πσ²e^-x-μ²/2σ²,-∞x+∞其中μ为位置参数,σ0为尺度参数,分别对应分布的期望和标准差记作X~Nμ,σ²标准正态分布当μ=0,σ=1时,称为标准正态分布,记为Z~N0,1其密度函数为φz=1/√2πe^-z²/2,分布函数记为Φz任何正态随机变量X~Nμ,σ²都可以通过线性变换Z=X-μ/σ转换为标准正态随机变量性质正态分布具有对称性、峰度稳定性、可加性等重要性质独立的正态随机变量的线性组合仍然服从正态分布由于中心极限定理,许多实际问题中的随机变量可以近似为正态分布随机变量函数的分布离散型随机变量函数连续型随机变量函数对于离散型随机变量X,设Y=gX,则Y的分布律可通过下列步骤对于连续型随机变量X,求Y=gX的分布有以下方法确定•分布函数法先求F_Yy=PY≤y=PgX≤y,再求导得到密•确定Y的所有可能取值y₁,y₂,...,yₘ度函数•对每个yᵢ,找出使gX=yᵢ的所有x值•公式法若gx严格单调,X的密度为f_Xx,则Y的密度为f_Yy=f_Xg^-1y|dg^-1y/dy|•计算PY=yᵢ=PgX=yᵢ=PX∈{x:gx=yᵢ}=∑PX=x例如,若X~Nμ,σ²,Y=aX+ba≠0,则Y~Naμ+b,a²σ²例如,若X~Bn,p,Y=n-X,则Y~Bn,1-p随机变量函数的分布问题在实际应用中非常重要,因为我们经常需要对原始数据进行变换,以便更好地分析和理解数据掌握这些方法可以帮助我们确定变换后随机变量的分布特征,从而进行概率计算和统计推断第三章多维随机变量及其分布多维随机变量由多个随机变量组成的向量联合分布描述多个随机变量共同分布规律边缘分布从联合分布导出的单个变量分布相关性分析研究变量间的依赖关系本章主要研究由两个或多个随机变量组成的随机向量,包括它们的联合分布、边缘分布、条件分布以及随机变量之间的独立性和相关性多维随机变量的理论是研究复杂随机系统的基础,在多变量统计分析、随机过程、机器学习等领域有重要应用二维随机变量的概念定义离散型二维随机变量二维随机变量X,Y是指由两个随机变如果二维随机变量X,Y的所有可能取量X和Y构成的有序对从几何角度看,值是有限个或可列无限个点,则称二维随机变量可以表示为平面上的随X,Y为离散型二维随机变量其分布机点二维随机变量的取值规律由其用联合分布律px,y=PX=x,Y=y表联合分布完全确定示,满足px,y≥0且∑∑px,y=1连续型二维随机变量如果存在非负函数fx,y,使得对任意平面区域D,有PX,Y∈D=∫∫_Dfx,ydxdy,则称X,Y为连续型二维随机变量,fx,y称为联合概率密度函数,满足fx,y≥0且∫∫_R²fx,ydxdy=1二维随机变量是研究随机变量之间相互关系的基本工具通过分析二维随机变量的联合分布,可以理解两个随机变量的依赖结构,计算它们的相关程度,并预测一个变量基于另一个变量取值的条件分布这些分析对于建模复杂系统、进行数据分析和统计推断具有重要意义二维随机变量的联合分布联合分布函数离散型的联合分布律二维随机变量X,Y的联合分布函数定义为离散型二维随机变量的联合分布律是指函数px,y=PX=x,Y=y,它给出随机点X,Y取各种可能值的概率联合分布律通常用表格Fx,y=PX≤x,Y≤y表示,满足它表示事件{X≤x,Y≤y}发生的概率,即随机点X,Y落入左下象限-•对所有x,y,px,y≥0∞,x]×-∞,y]的概率联合分布函数完整描述了二维随机变量的概•∑∑px,y=1,其中求和范围为X和Y的所有可能取值率分布,满足以下性质联合分布函数可以通过联合分布律计算Fx,y=∑∑ps,t,其中•0≤Fx,y≤1求和范围为s≤x且t≤y的所有s,t值•F-∞,y=Fx,-∞=0,F+∞,+∞=1•Fx,y关于x和y分别单调不减•Fx,y关于x和y分别右连续连续型二维随机变量的联合密度函数fx,y满足Fx,y=∫_-∞^x∫_-∞^y fs,tdtds,且fx,y=∂²Fx,y/∂x∂y(在偏导数存在处)对任意平面区域D,有PX,Y∈D=∫∫_D fx,ydxdy边缘分布X\Y y₁y₂y₃p_Xxx₁
0.
10.
20.
10.4x₂
0.
30.
10.
20.6p_Yy
0.
40.
30.31边缘分布是指从二维随机变量X,Y的联合分布中导出的单个随机变量X或Y的分布边缘分布函数可以直接从联合分布函数得到F_Xx=PX≤x=PX≤x,Y+∞=Fx,+∞F_Yy=PY≤y=PX+∞,Y≤y=F+∞,y对于离散型二维随机变量,边缘分布律通过联合分布律的求和得到p_Xx=PX=x=∑_y px,yp_Yy=PY=y=∑_x px,y对于连续型二维随机变量,边缘密度函数通过联合密度函数的积分得到f_Xx=∫_-∞^+∞fx,ydyf_Yy=∫_-∞^+∞fx,ydx条件分布离散型的条件分布连续型的条件分布对于离散型二维随机变量X,Y,已知Y=y,X的条件分布律定义为对于连续型二维随机变量X,Y,已知Y=y,X的条件密度函数定义为PX=x|Y=y=PX=x,Y=y/PY=y=px,y/p_Yy f_Xx|Y=y=fx,y/f_Yy其中p_Yy0类似地,已知X=x,Y的条件分布律为其中f_Yy0类似地,已知X=x,Y的条件密度函数为PY=y|X=x=px,y/p_Xx f_Yy|X=x=fx,y/f_Xx其中p_Xx0条件分布律满足非负性和归一性,即∑_x其中f_Xx0条件密度函数满足非负性和归一性,即∫_-∞^+∞PX=x|Y=y=1f_Xx|Y=ydx=1条件分布描述了在给定一个随机变量取值的条件下,另一个随机变量的分布规律它是研究随机变量之间相互依赖关系的重要工具,在统计推断、回归分析、贝叶斯分析等领域有广泛应用条件分布也是理解随机变量独立性的关键X和Y独立当且仅当X在给定Y任意值的条件下的分布与X的边缘分布相同随机变量的独立性定义若对任意x,y,有Fx,y=F_XxF_Yy,则称X,Y相互独立离散型的判断2当且仅当对任意x,y,有px,y=p_Xxp_Yy连续型的判断3当且仅当对任意x,y,有fx,y=f_Xxf_Yy随机变量的独立性是概率论中的核心概念,它表明随机变量之间没有依赖关系,一个变量取值的信息不会改变对另一个变量分布的认识从条件分布角度看,X和Y独立当且仅当对任意y,有f_Xx|Y=y=f_Xx,或对任意x,有f_Yy|X=x=f_Yy独立性具有重要性质若X和Y独立,则gX和hY也独立,其中g和h是任意函数;独立随机变量的函数的数学期望满足E[gXhY]=E[gX]E[hY];独立随机变量的和的分布可以通过卷积计算这些性质使得独立性在概率论的理论分析和应用中占据核心地位二维正态分布定义参数含义二维随机变量X,Y的联合密度函数为特定形式1μ₁,μ₂为均值,σ₁,σ₂为标准差,ρ为相关系数的指数函数,包含五个参数2性质等高线4边缘分布为一维正态分布,条件分布也是正态分密度函数的等高线为椭圆,椭圆方向由相关系数布ρ决定二维正态分布是最重要的二维连续型分布,其联合密度函数为fx,y=[1/2πσ₁σ₂√1-ρ²]exp{-[1/21-ρ²][x-μ₁/σ₁²-2ρx-μ₁/σ₁y-μ₂/σ₂+y-μ₂/σ₂²]}其中|ρ|1当ρ=0时,X和Y独立,密度函数等高线为椭圆的主轴平行于坐标轴;当ρ≠0时,X和Y不独立,密度函数等高线为椭圆的主轴倾斜二维正态分布的边缘分布为一维正态分布X~Nμ₁,σ₁²,Y~Nμ₂,σ₂²条件分布也是正态分布X|Y=y~Nμ₁+ρσ₁/σ₂y-μ₂,σ₁²1-ρ²随机变量的函数的分布两个随机变量和的分布若X和Y独立,则Z=X+Y的分布函数为卷积公式对离散型p_Zz=∑_x p_Xxp_Yz-x对连续型f_Zz=∫_-∞^+∞f_Xxf_Yz-xdx两个随机变量积的分布若X和Y独立,则Z=XY的密度函数可以通过变量变换或卷积积分求得特别地,若X和Y都是标准正态分布,则Z=XY的密度函数为f_Zz=1/πK₀|z|,其中K₀是修正的贝塞尔函数与的分布M=maxX,Y N=minX,Y若X和Y独立,则F_Mz=F_XzF_YzF_Nz=1-1-F_Xz1-F_Yz随机变量函数的分布问题在实际应用中极为重要特别地,对于n个独立同分布的随机变量X₁,X₂,...,Xₙ,其和S_n=X₁+X₂+...+X_n的分布是统计学和应用概率论中的核心问题当X_i服从正态分布时,S_n仍服从正态分布;当X_i服从二项分布B1,p时,S_n服从二项分布Bn,p;当X_i服从泊松分布Pλ时,S_n服从泊松分布Pnλ第四章随机变量的数字特征数学期望随机变量的平均值,表示集中趋势方差与标准差描述随机变量取值的分散程度协方差与相关系数衡量两个随机变量之间的相关程度矩刻画分布的形状特征,如偏度和峰度随机变量的数字特征是用数值来描述随机变量分布的特性,它们从不同侧面反映了分布的集中趋势、离散程度和形状特征虽然数字特征通常不能完全确定分布,但它们提供了分布的关键信息,便于进行统计分析和比较本章将系统介绍随机变量的各种数字特征及其性质,为统计推断和数据分析奠定基础期望定义离散型随机变量的期望连续型随机变量的期望随机变量X的数学期望(均值)是X所有可对离散型随机变量X,其期望定义为对连续型随机变量X,其期望定义为能取值的加权平均,权重为相应的概率EX=∑_i x_i px_i EX=∫_-∞^+∞x fxdx期望反映了随机变量的集中趋势,是分布的重心其中求和范围是X的所有可能取值当当积分∫|x|fxdx收敛时,期望才存在∑|x_i|px_i收敛时,期望才存在例如,例如,指数分布X~Expλ的期望为从物理角度看,如果在数轴上每个点x处几何分布X~Geop的期望为EX=1/p EX=1/λ放置质量为px或fxdx的小质点,则期望就是质点系的重心位置期望的性质线性性独立随机变量积的期望期望具有线性性,即对任意常数a、b若随机变量X和Y相互独立,则它们乘和随机变量X、Y,有积的期望等于期望的乘积EaX+bY=aEX+bEY EXY=EXEY这一性质对于任意有限个随机变量的这一性质推广到任意有限个相互独立线性组合都成立,不要求随机变量相的随机变量若X₁,X₂,...,Xₙ相互独立,互独立线性性使得我们可以便捷地则EX₁X₂...Xₙ=EX₁EX₂...EXₙ计算随机变量线性组合的期望随机变量函数的期望对于随机变量X的函数gX,其期望为对离散型EgX=∑_i gx_ipx_i对连续型EgX=∫_-∞^+∞gxfxdx特别地,EX²称为X的二阶原点矩,是计算方差的基础方差σ²E[X-μ²]EX²-[EX]²方差的符号定义公式计算公式方差通常用σ²或VarX表示随机变量与其期望偏离的平方的平均值二阶原点矩减去期望的平方方差是描述随机变量波动或离散程度的重要特征,它度量了随机变量取值与其期望的偏离程度方差越大,表示随机变量的波动性越强,取值越分散;方差越小,表示随机变量的取值越集中在期望附近方差具有如下性质方差恒非负,且当且仅当随机变量以概率1取常数值时方差为零;常数的方差为零,即Varc=0;对任意常数a和b,有VaraX+b=a²VarX,即方差不具有线性性;若随机变量X和Y相互独立,则VarX+Y=VarX+VarY,这一性质推广到任意有限个相互独立的随机变量标准差定义单位一致性标准差是方差的算术平方根,记为σ或SDX与随机变量同单位,便于理解和比较在正态分布中的意义性质约68%的值落在μ±σ范围内,95%落在μ±2σ内3非负性,线性变换下的比例变化标准差相比方差更直观,因为它与随机变量具有相同的量纲例如,如果身高的单位是厘米,则其方差的单位是厘米的平方,而标准差的单位仍然是厘米,便于理解和解释标准差是衡量数据分散程度的常用指标,在统计学、金融学、质量控制等领域有广泛应用在金融投资中,标准差常被用作衡量资产风险的指标;在质量控制中,产品尺寸的标准差反映了制造过程的稳定性对于一批完整数据,我们可以类比地定义其样本标准差,作为总体标准差的估计切比雪夫不等式定理应用切比雪夫不等式给出了随机变量取值偏切比雪夫不等式提供了随机变量取值与离期望的概率上界设随机变量X具有有期望偏差的概率估计,适用于任何具有限期望EX=μ和有限方差VarX=σ²,则有限方差的分布,不需要知道分布的具对任意正数ε,有体形式这使它在理论分析和实际应用中非常有用,特别是当我们只知道分布P|X-μ|≥ε≤σ²/ε²的某些数字特征而不知道完整分布时或等价地,对任意正数k,有例如,对于k=2,不等式给出P|X-P|X-μ|≥kσ≤1/k²μ|≥2σ≤1/4,即随机变量X落在区间[μ-2σ,μ+2σ]外的概率不超过1/4,或者说,X落在这个区间内的概率至少为3/4重要性切比雪夫不等式是概率论中的基本工具,它为大数定律提供了理论基础不等式表明,随机变量的取值主要集中在期望附近,偏离期望越远的概率越小虽然这一估计通常比特定分布(如正态分布)得到的估计更为粗糙,但其普适性使它在概率论的理论研究中具有重要地位协方差协方差是度量两个随机变量线性相关程度的数值特征设X和Y是两个随机变量,且具有有限的期望EX=μₓ和EY=μᵧ,则X和Y的协方差定义为CovX,Y=E[X-μₓY-μᵧ]=EXY-EXEY协方差具有以下性质CovX,X=VarX;CovX,Y=CovY,X;对任意常数a,b,c,d,有CovaX+b,cY+d=acCovX,Y;若X和Y独立,则CovX,Y=0(注意反过来不一定成立);n个随机变量和的方差为VarX₁+X₂+...+Xₙ=ΣᵢVarXᵢ+2ΣᵢΣⱼ₍ᵢ₎CovXᵢ,Xⱼ相关系数矩原点矩随机变量X的k阶原点矩定义为EX^k,表示X的k次方的期望1阶原点矩就是期望EX,2阶原点矩EX²用于计算方差中心矩随机变量X的k阶中心矩定义为E[X-EX^k],表示X与其期望偏差的k次方的期望1阶中心矩为0,2阶中心矩就是方差偏度标准化的3阶中心矩,定义为γ₁=E[X-μ³]/σ³,描述分布的不对称性正偏度表示分布右侧拖尾,负偏度表示分布左侧拖尾峰度标准化的4阶中心矩,定义为γ₂=E[X-μ⁴]/σ⁴,描述分布峰值的尖锐程度和尾部的重量正态分布的峰度为3,更高的值表示更尖锐的峰值和更重的尾部第五章大数定律和中心极限定理概率论的基本极限定理1揭示了随机变量序列的极限行为规律大数定律2阐明了样本均值收敛于总体均值的条件和方式中心极限定理3说明了大量独立随机变量之和的分布近似正态分布随机过程理论基础4为理解复杂随机系统提供了理论框架第五章介绍概率论中最深刻的理论成果——大数定律和中心极限定理这些定理揭示了随机现象在大量重复中呈现出的规律性,解释了为什么众多实际问题中的随机变量会表现出正态分布的特征它们不仅具有重要的理论意义,也为统计推断和实际应用提供了坚实的基础大数定律的概念弱大数定律强大数定律弱大数定律表明,随机变量序列的算术平均值依概率收敛于期望强大数定律表明,随机变量序列的算术平均值几乎必然收敛于期具体来说,设X₁,X₂,...,Xₙ,...是相互独立且服从同一分布的随机变望设X₁,X₂,...,Xₙ,...满足一定条件,则量序列,具有相同的期望EXᵢ=μ,则对任意ε0,有Plimn→∞1/n·∑ᵢ₌₁ⁿXᵢ=μ=1limn→∞P|1/n·∑ᵢ₌₁ⁿXᵢ-μ|ε=1强大数定律比弱大数定律要求更强的收敛性,它保证样本均值几弱大数定律保证了在大样本条件下,样本均值是总体均值的良好乎必然(即以概率1)收敛到总体均值估计大数定律是概率论中的基本定理,它表明在大量重复观察下,随机现象会呈现出统计规律性这一定律为频率学派的概率解释提供了理论基础,同时也是统计推断的理论依据在实际应用中,大数定律解释了为什么抽样调查能够有效地反映总体特征,为蒙特卡洛方法等计算技术提供了理论支持切比雪夫大数定律定理证明思路12切比雪夫大数定律是最基本的大证明的核心是应用切比雪夫不等数定律之一,适用条件较为宽松式估计随机变量和的偏差概率设X₁,X₂,...,Xₙ,...是两两不相关的计算1/n·∑ᵢ₌₁ⁿXᵢ的方差,利用变量随机变量序列,具有期望EXᵢ=μᵢ不相关性得到方差为1/n²·∑ᵢ₌₁ⁿσᵢ和有界方差VarXᵢ=σᵢ²≤C(C为常²≤C/n由切比雪夫不等式,数),则对任意ε0,有P|1/n·∑ᵢ₌₁ⁿXᵢ-1/n·∑ᵢ₌₁ⁿμᵢ|≥ε≤C/nε²,当n→∞时,右边趋于0limn→∞P|1/n·∑ᵢ₌₁ⁿXᵢ-1/n·∑ᵢ₌₁ⁿμᵢ|ε=1应用3切比雪夫大数定律是统计估计理论的基础,它保证了样本均值是总体均值的有效估计当随机变量具有相同的期望μ时,定理简化为limn→∞P|1/n·∑ᵢ₌₁ⁿXᵢ-μ|ε=1这一结果应用于抽样调查、实验设计和质量控制等领域,为样本量的确定提供了理论依据伯努利大数定律辛钦大数定律定理内容条件重要性辛钦大数定律是独立同分布随机变量序列的与切比雪夫大数定律相比,辛钦大数定律不辛钦大数定律是统计学的基石,它保证了在大数定律,它只要求随机变量具有有限的期要求方差有界,只需要期望存在即可这使大样本条件下,样本均值是总体均值的一致望设X₁,X₂,...,Xₙ,...是独立同分布的随机变得它适用于更广泛的随机变量类,包括某些估计这一定律在蒙特卡洛模拟、采样理论、量序列,具有相同的期望EXᵢ=μ,则对任重尾分布的随机变量机器学习等领域有重要应用意ε0,有但辛钦定律要求随机变量独立同分布,而切辛钦定律还可推广到更一般的情形,如随机比雪夫定律只要求随机变量不相关且方差有变量的函数的均值收敛性,为期望的蒙特卡limn→∞P|1/n·∑ᵢ₌₁ⁿXᵢ-μ|ε=1界两种定律各有适用范围洛估计提供了理论支持中心极限定理的概念定义大量相互独立的随机因素叠加,其和近似服从正态分布核心思想大量独立随机变量之和的分布趋于正态分布,无论各个随机变量本身的分布如何基本类型独立同分布的中心极限定理、李雅普诺夫中心极限定理、林德伯格-费勒中心极限定理等中心极限定理是概率论中最深刻、最重要的定理之一,它解释了为什么正态分布在自然和社会现象中如此普遍该定理表明,大量独立随机变量之和的分布,经适当标准化后,会趋近于标准正态分布,而不依赖于这些随机变量各自的原始分布中心极限定理在统计推断、抽样理论、随机过程和物理学等领域有广泛应用它为基于正态性假设的统计方法提供了理论依据,即便原始数据不服从正态分布,当样本量足够大时,样本均值的抽样分布仍近似服从正态分布这使得z检验、t检验等统计方法在大样本条件下具有良好的稳健性独立同分布的中心极限定理独立同分布的中心极限定理是最基本的中心极限定理,它适用于独立同分布的随机变量序列设X₁,X₂,...,Xₙ,...是独立同分布的随机变量序列,具有相同的期望EXᵢ=μ和方差VarXᵢ=σ²0,则随机变量和的标准化形式Zₙ=∑ᵢ₌₁ⁿXᵢ-nμ/σ√n的分布函数Fₙx当n→∞时收敛于标准正态分布函数Φx,即对任意实数x,有limn→∞Fₙx=Φx=1/√2π∫₍₋∞₎ˣe^-t²/2dt这意味着,当n很大时,∑ᵢ₌₁ⁿXᵢ近似服从参数为nμ,nσ²的正态分布,或者说,样本均值X̄=1/n·∑ᵢ₌₁ⁿXᵢ近似服从参数为μ,σ²/n的正态分布李雅普诺夫中心极限定理定理李雅普诺夫中心极限定理是一个更一般的中心极限定理,适用于不要求同分布的随机变量序列设X₁,X₂,...,Xₙ,...是相互独立的随机变量序列,具有期望EXᵢ=μᵢ和方差VarXᵢ=σᵢ²0,记Bₙ²=∑ᵢ₌₁ⁿσᵢ²若存在δ0,使得当n→∞时,1/Bₙ^2+δ∑ᵢ₌₁ⁿE|Xᵢ-μᵢ|^2+δ→0则随机变量和的标准化形式Zₙ=∑ᵢ₌₁ⁿXᵢ-∑ᵢ₌₁ⁿμᵢ/Bₙ的分布函数当n→∞时收敛于标准正态分布函数条件李雅普诺夫条件本质上要求没有任何一个随机变量在和中起主导作用,即各随机变量对和的贡献相对均衡具体来说,就是要求2+δ阶绝对中心矩相对于方差和的比重趋于零这个条件比独立同分布的中心极限定理宽松,允许随机变量有不同的分布,但要求存在高于2阶的矩当随机变量独立同分布时,李雅普诺夫条件自动满足,此时李雅普诺夫定理退化为经典的中心极限定理棣莫弗拉普拉斯定理-定理与中心极限定理的关系棣莫弗-拉普拉斯定理是中心极限定理在二项分布中的特例,也是棣莫弗-拉普拉斯定理可以看作是中心极限定理的一个特例事实最早的中心极限定理形式设随机变量Sₙ服从参数为n和p0上,二项随机变量Sₙ可以表示为n个独立同分布的0-1随机变量的和,每个0-1随机变量以概率p取值1,以概率1-p取值0这正好符limn→∞Px₁Sₙ-np/√np1-px₂=1/√2π∫₍ₓ₁₎^x₂合独立同分布的中心极限定理的条件e^-t²/2dt棣莫弗-拉普拉斯定理在历史上具有重要地位,它是最早的中心极这意味着,当n足够大时,二项随机变量Sₙ的标准化形式近似服从限定理形式,由棣莫弗在1733年针对特殊情况(p=1/2)首次提标准正态分布N0,1,或者说,Sₙ近似服从正态分布Nnp,np1-出,后由拉普拉斯在1812年推广到一般情况p在二项分布中的应用方面,当n很大时(通常n≥30,且np≥5,n1-p≥5),可以用正态分布近似计算二项概率Pa≤Sₙ≤b,即Pa≤Sₙ≤b≈Φb+
0.5-np/√np1-p-Φa-
0.5-np/√np1-p,其中连续性校正(±
0.5)提高了近似精度总复习要点重点概念回顾常用公式总结•随机试验、样本空间、随机事件•加法公式PA∪B=PA+PB-PAB•概率的公理化定义及性质•乘法公式PAB=PAPB|A•条件概率、全概率公式、贝叶斯公式•全概率公式PA=∑ᵢPB_iPA|B_i•随机变量及其分布•贝叶斯公式PB_i|A=PB_iPA|B_i/PA•期望、方差、协方差、相关系数2•期望EaX+bY=aEX+bEY•大数定律、中心极限定理•方差VaraX+b=a²VarX解题技巧常见分布特征•明确样本空间和事件43•二项分布EX=np,VarX=np1-p•灵活运用条件概率•泊松分布EX=λ,VarX=λ•巧用全概率公式和贝叶斯公式•均匀分布EX=a+b/2,VarX=b-a²/12•利用随机变量简化计算•指数分布EX=1/λ,VarX=1/법注意独立性与互斥性的区别•正态分布EX=μ,VarX=σ²•合理应用各种分布的性质典型例题分析例题条件概率与贝叶斯公式例题随机变量函数的分布12某工厂生产的产品中,A、B、C三种机器的产量分别占总产量的25%、35%设随机变量X服从参数为λ=2的指数分布,求Y=X²的概率密度函数和40%三种机器的次品率分别为3%、2%和1%从产品中随机抽取一件,解指数分布的密度函数为f_Xx=2e^-2x,x0由于Y=X²且X0,所发现是次品,问这件次品来自C机器的概率是多少?以X=√Y是严格单调的通过变量变换公式解设事件A_i表示产品由第i种机器生产,事件B表示产品是次品根据f_Yy=f_Xg^-1y×|dg^-1y/dy|贝叶斯公式其中g^-1y=√y,dg^-1y/dy=1/2√yPA_C|B=PA_CPB|A_C/[PA_APB|A_A+PA_BPB|A_B+PA_CPB|A_C]所以f_Yy=2e^-2√y×1/2√y=e^-2√y/√y,y0=
0.4×
0.01/[
0.25×
0.03+
0.35×
0.02+
0.4×
0.01]这是参数为2的瑞利分布的平方的密度函数=
0.004/
0.0175=4/
17.5≈
0.229例题3二维正态分布的条件期望若X,Y服从二维正态分布,且EX=1,EY=2,VarX=4,VarY=9,CovX,Y=3,求EY|X=3和VarY|X=3解二维正态分布的条件分布也是正态分布,且条件期望EY|X=x=EY+ρσ_Y/σ_Xx-EX,条件方差VarY|X=x=σ_Y²1-ρ²,其中ρ为相关系数计算得ρ=CovX,Y/σ_X·σ_Y=3/2·3=
0.5,σ_X=2,σ_Y=3所以EY|X=3=2+
0.5·3/2·3-1=2+
1.5=
3.5,VarY|X=3=9·1-
0.25=
6.75结语课程总结本课程系统讲解了概率论的基本概念、随机变量及其分布、多维随机变量、随机变量的数字特征以及大数定律和中心极限定理通过学习,你应该已经掌握了用概率方法分析随机现象的基本思路和技术,建立了概率思维,理解了随机现象背后的确定性规律学习建议概率论学习需要理论与实践相结合建议在理解基本概念和定理的基础上,多做习题,尤其是应用题,以加深对理论的理解可以利用统计软件如R、Python等进行概率模拟实验,直观感受概率规律同时,关注概率论在实际问题中的应用,提高解决实际问题的能力后续学习方向掌握概率论基础后,可以进一步学习数理统计、随机过程、随机微分方程等课程,或者探索概率论在金融数学、通信理论、生物统计、机器学习等领域的应用概率思维和随机分析方法将成为你解决复杂问题的强大工具预祝考试成功希望你已经通过本复习课件掌握了概率论的核心内容考试前建议重点复习条件概率、随机变量的分布与数字特征以及大数定律和中心极限定理等内容祝你考试取得优异成绩!记住,概率论不仅是一门考试科目,更是一种思维方式,它将帮助你在不确定的世界中做出更好的决策。
个人认证
优秀文档
获得点赞 0