还剩58页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
概率论重要公式复习课件欢迎参加概率论重要公式复习课程本课件系统地整理了概率论中的核心概念和关键公式,旨在帮助大家掌握概率论的基本理论和应用方法我们将从基础概念入手,逐步深入到复杂理论,并通过例题讲解帮助大家理解和记忆这些公式概率论作为数学的一个重要分支,广泛应用于科学研究、工程技术、经济管理等领域掌握好概率论的基本理论和方法,对于解决实际问题具有重要意义希望本课件能够成为大家学习和复习的有力工具课程概述概率论基础重要公式及应用我们将首先回顾概率论的基本系统梳理概率论中的重要公式,概念,包括随机试验、样本空包括概率计算公式、随机变量间、事件以及概率的定义和性的分布、数字特征等,并解释质这些是理解后续内容的重其数学意义和应用场景要基础例题讲解通过具体例题演示各种公式的应用方法,帮助理解公式背后的数学思想,提高解题能力和应用能力本课程将帮助你构建完整的概率论知识体系,掌握关键公式的应用技巧,为后续学习数理统计和随机过程等高级课程打下坚实基础概率的基本概念随机试验样本空间事件随机试验是在相同条件下可重复进行的试样本空间是随机试验所有可能结果的集合,事件是样本空间的子集,表示随机试验可验,其结果具有不确定性,但所有可能结通常用表示样本空间中的元素称为样能出现的结果集合当随机试验的结果属Ω果可以预先知道随机试验是概率论研究本点,表示随机试验的一个基本结果于事件A时,我们称事件A发生的对象基本事件是只含有一个样本点的事件;必例如掷骰子、抛硬币、从一批产品中抽例如掷一枚骰子的样本空间为然事件是样本空间本身;不可能事件是空检等都属于随机试验Ω={1,2,3,4,5,6}集事件的关系与运算包含关系并、交、差运算若事件A中的每个样本点都是事件B的事件的并A∪B表示事件A与事件B样本点,则称A包含于B,记为A⊂B至少有一个发生此时,当事件A发生时,事件B必然发事件的交A∩B或AB表示事件A与事生件B同时发生特殊情况若A⊂B且B⊂A,则A=B,事件的差A-B表示事件A发生但事即两个事件完全相同件B不发生事件的补A^c表示事件A不发生互斥事件若事件A与事件B不可能同时发生,即A∩B=∅,则称A与B互斥或互不相容对于任意事件A,A与A^c互斥,且A∪A^c=Ω,A∩A^c=∅概率的定义古典概型当样本空间中每个基本事件发生的可能性相等时,事件A的概率为A中基本事件数频率学派与样本空间基本事件总数之比概率定义为随机试验中事件发生的频率,即当试验次数趋于无穷时,事件发生的几何概型频率趋于稳定值当样本点落在区域D的任一位置的可能性相等时,事件A的概率为A所对应区域的度量与D的度量之比概率提供了度量事件不确定性的数学工具不同定义适用于不同情况古典概型要求有限多个等可能的基本事件;几何概型处理连续样本空间;频率学派的定义具有普遍性,但需要大量重复试验概率的公理化定义非负性对于任意事件A,其概率PA≥0,即概率是非负的这反映了概率作为度量的基本要求,不存在发生可能性为负的事件规范性必然事件的概率等于1,即PΩ=1这表示随机试验的结果必然在样本空间中,并将概率值规范在[0,1]区间可列可加性对于两两互斥的事件序列A₁,A₂,...,有PA₁∪A₂∪...=PA₁+PA₂+...这是概率满足的基本运算性质公理化定义由苏联数学家柯尔莫哥洛夫于1933年提出,为概率论的发展奠定了严格的数学基础这种定义方式不依赖于特定类型的随机试验,具有普遍适用性,使概率论成为现代数学的一个分支概率的基本性质PΩ=1必然事件的概率为1∅P=0不可能事件的概率为00≤PA≤1任意事件的概率在0到1之间概率的这些基本性质直接源于公理化定义必然事件的概率为1是由第二条公理直接给出的不可能事件∅的概率为0可以通过可列可加性从PΩ=1推导出来任何事件A都满足∅⊆A⊆Ω,因此其概率值必然介于0和1之间此外,若A⊆B,则PA≤PB;对于任意事件A,有PA^c=1-PA这些性质在解题中经常使用加法公式∪PA BPA+PB两个事件并集的概率两个事件概率之和等于两个事件概率之和减去交集概率直接相加可能重复计算交集部分-PA∩B交集概率的修正减去重复计算的部分加法公式PA∪B=PA+PB-PA∩B是计算两个事件并集概率的基本公式该公式反映了集合运算中的包含-排除原理当直接将两个事件的概率相加时,交集部分被重复计算了两次,因此需要减去一次交集的概率特殊情况当事件A与B互斥时,PA∩B=0,此时有PA∪B=PA+PB这称为概率的有限可加性,是可列可加性在有限情况下的特例加法公式的推广加法公式可以推广到三个或更多事件的情况对于三个事件A、B、C,其并集的概率计算公式为PA∪B∪C=PA+PB+PC-PA∩B-PA∩C-PB∩C+PA∩B∩C一般地,对于n个事件A₁,A₂,...,A,其并集的概率计算需要应用包含-排除原理先将各事件的概率相加,然后减去两两交集的概率,再加上三个事件交集ₙ的概率,依此类推,最后加上或减去n个事件交集的概率(取决于n的奇偶性)减法公式事件A起始事件,概率为PA减去交集从A中排除与B的公共部分差集A-B结果为A发生但B不发生的事件减法公式PA-B=PA-PA∩B用于计算差集事件的概率事件A-B表示A发生但B不发生,等价于A∩B^c此公式可以从集合运算的角度理解从事件A中排除与事件B的交集部分,就得到了差集特殊情况当A⊆B时,A∩B=A,此时PA-B=PA-PA=0,这与集合性质A-B=∅是一致的利用减法公式,结合事件的补集关系,可以求解许多复杂的概率问题条件概率PB|A=PA∩B/PA在事件A已发生的条件下,事件B发生的概率PA∩B事件A与事件B同时发生的概率PA0条件事件A必须是可能发生的条件概率PB|A表示在已知事件A发生的条件下,事件B发生的概率它反映了事件之间的相关性,是概率论中的重要概念条件概率可以看作是在缩小的样本空间(事件A)中考虑事件B发生的概率条件概率的定义为PB|A=PA∩B/PA,其中PA0通过条件概率,我们可以利用已知信息更新对未知事件的概率估计,这是贝叶斯统计和机器学习的基础乘法公式公式表达式PA∩B=PA·PB|A条件PA0含义两事件交集概率等于一个事件的概率乘以另一事件的条件概率对称形式PA∩B=PB·PA|B,当PB0乘法公式PA∩B=PA·PB|A是由条件概率的定义直接变形得到的它提供了计算两个事件交集概率的方法,特别适用于序贯事件的概率计算乘法公式有对称形式PA∩B=PB·PA|B,当PB0时成立在应用时,可以根据已知条件选择更便于计算的形式此公式是解决复杂概率问题的重要工具,尤其在树状图分析和马尔可夫过程中经常使用乘法公式的推广两个事件PA∩B=PA·PB|A三个事件PA∩B∩C=PA·PB|A·PC|A∩Bn个事件PA₁∩A₂∩...∩A=PA₁·PA₂|A₁·PA₃|A₁∩A₂·...·PA|A₁∩A₂∩...∩Aₙₙₙ₋₁乘法公式可以推广到多个事件的情况对于三个事件A、B、C的交集概率,可以表示为PA∩B∩C=PA·PB|A·PC|A∩B这个公式描述了事件按特定顺序依次发生的概率一般地,对于n个事件A₁,A₂,...,A的交集概率,乘法公式为PA₁∩A₂∩...∩A=ₙₙPA₁·PA₂|A₁·PA₃|A₁∩A₂·...·PA|A₁∩A₂∩...∩A这个公式常用于解ₙₙ₋₁决序贯试验和多阶段随机过程的概率问题全概率公式全概率公式样本空间划分应用场景PA=PB₁·PA|B₁+PB₂·PA|B₂+...事件B₁,B₂,...,B构成样本空间的一个划分当事件A可能通过多个互斥途径发生时ₙ+PB·PA|Bₙₙ•B₁∪B₂∪...∪B=Ω•分层抽样ₙ•B₁,B₂,...,B两两互斥•复杂系统可靠性分析ₙ•PBᵢ0,i=1,2,...,n•多通道通信2全概率公式提供了一种将复杂问题分解为简单子问题的方法当直接计算事件A的概率困难,但可以根据条件B₁,B₂,...,B分别计算条件概率ₙPA|Bᵢ时,全概率公式特别有用公式本质上是对事件A按照样本空间的一个划分进行分类讨论贝叶斯公式公式表达先验与后验PBᵢ|A=[PBᵢ·PA|Bᵢ]/PBᵢ先验概率,表示对Bᵢ的初始判[PB₁·PA|B₁+PB₂·PA|B₂断+...+PB·PA|B]ₙₙPBᵢ|A后验概率,表示在观察到事=[PBᵢ·PA|Bᵢ]/PA件A后对Bᵢ的修正判断应用场景医学诊断根据症状推断疾病概率垃圾邮件过滤根据邮件特征判断是否为垃圾邮件可靠性分析根据故障现象推断故障原因贝叶斯公式是条件概率的一个重要应用,由英国数学家托马斯·贝叶斯提出它实现了概率的逆向推理已知结果A的条件下,推断原因Bᵢ的概率贝叶斯公式的分母实际上是全概率公式,等于PA事件的独立性定义多事件独立性独立性与互斥性如果PA∩B=PA·PB,则称事件A与B三个事件A、B、C相互独立,需满足独立与互斥是两个不同的概念相互独立•PA∩B=PA·PB若A与B互斥且PA0,PB0,则A与B独立性表示一个事件的发生不影响另一个必然不独立•PA∩C=PA·PC事件发生的概率,即PB|A=PB或•PB∩C=PB·PC独立事件强调概率的乘积关系,互斥事件PA|B=PA强调集合的交集为空•PA∩B∩C=PA·PB·PC注意前三个条件不足以保证第四个条件自动成立!伯努利试验定义特点伯努利试验是只有两种可能结果伯努利试验序列是n次独立重复的的随机试验,通常称为成功和伯努利试验关键特性是每次失败每次试验中成功的概率为试验只有两种可能结果;每次试p,失败的概率为1-p,且各次试验的概率保持不变;各次试验相验相互独立互独立实例典型的伯努利试验包括抛硬币(正面为成功,反面为失败);质量检验(合格为成功,不合格为失败);射击(命中为成功,未命中为失败)伯努利试验是概率论中最基本的随机试验模型之一,由瑞士数学家雅各布·伯努利提出它为二项分布、几何分布等重要离散分布奠定了基础,广泛应用于质量控制、信号传输、金融风险等领域二项分布二项分布是n次独立重复的伯努利试验中成功次数的概率分布若X表示n次试验中成功的次数,则X服从参数为n和p的二项分布,记为X~Bn,p其概率质量函数为PX=k=Cn,k·p^k·1-p^n-k,k=0,1,2,...,n其中Cn,k为组合数,表示从n个元素中取k个元素的组合数二项分布的期望EX=np,方差DX=np1-p当n较大时,二项分布可以用正态分布近似泊松分布定义性质泊松分布是描述单位时间(或空间)泊松分布的期望和方差均为λ内随机事件发生次数的概率分布若泊松分布可以作为二项分布的极限形随机变量X服从参数为λ的泊松分布,式当n→∞,p→0,且np=λ时,记为X~Pλ,其概率质量函数为Bn,p近似于PλPX=k=λ^k·e^-λ/k!,k=0,1,2,...应用泊松分布广泛应用于描述单位时间内随机事件的发生次数,如•单位时间内到达的顾客数•单位面积内的缺陷数•单位时间内网站的访问次数超几何分布定义性质与应用超几何分布描述了从有限总体中不放回抽样的情况假设总体包超几何分布的期望EX=n·M/N,方差DX=n·M/N·1-含N个元素,其中M个具有某种特征,从中不放回地抽取n个元素,M/N·[N-n/N-1]令X表示抽取的n个元素中具有该特征的元素个数,则X服从超几当总体容量N很大时,超几何分布可以用二项分布Bn,p近似,其何分布中p=M/N其概率质量函数为PX=k=[CM,k·CN-M,n-k]/CN,n超几何分布常用于质量抽检、调查统计、选举预测等不放回抽样的情况超几何分布与二项分布的主要区别在于抽样方式超几何分布对应不放回抽样,各次抽取不独立;而二项分布对应放回抽样或各次试验相互独立的情况当总体容量N远大于样本容量n时,不放回抽样近似等价于放回抽样随机变量的概念定义离散型随机变量连续型随机变量随机变量是定义在样本空间上的实值函离散型随机变量的取值是有限个或可列无连续型随机变量的取值在某个区间内连续Ω数,将随机试验的每个可能结果映射为一穷多个例如变化例如个实数随机变量用大写字母X、Y、Z等•掷骰子的点数X∈{1,2,3,4,5,6}•随机点的坐标X∈[0,1]表示,其取值用相应的小写字母表示•家庭的孩子数X∈{0,1,2,...}•产品的寿命X∈[0,+∞•产品中的缺陷数X∈{0,1,2,...}•测量误差X∈-∞,+∞从数学上看,随机变量是从样本空间到Ω实数集R的映射X:Ω→R分布函数定义随机变量X的分布函数Fx定义为X取值不超过x的概率Fx=PX≤x,x∈R基本性质•单调性若x₁x₂,则Fx₁≤Fx₂•有界性0≤Fx≤1•右连续性Fx+0=Fx•极限性质F-∞=0,F+∞=1概率计算通过分布函数可以计算随机变量落在任意区间的概率PaX≤b=Fb-FaPXa=1-Fa分布函数完整地描述了随机变量的概率分布无论随机变量是离散型还是连续型,分布函数都存在且具有上述性质通过分布函数,可以计算随机变量落在任意区间的概率,这是概率计算的基础离散型随机变量的分布律定义离散型随机变量X的分布律是指其所有可能取值x_i及对应的概率p_i的集合,表示为PX=x_i=p_i,i=1,2,...性质p_i≥0,∑p_i=1(概率非负且和为1)表示方式可用表格、概率质量函数或列举的方式表示与分布函数的关系Fx=∑PX=x_i,其中求和是对所有满足x_i≤x的i进行的离散型随机变量的分布律是描述其概率分布的基本方式通过分布律,可以直接得到随机变量取某个特定值的概率分布律满足两个基本性质每个概率值非负,且所有概率之和等于1常见的离散型分布包括伯努利分布、二项分布、泊松分布、几何分布和超几何分布等每种分布都有其特定的分布律表达式和应用场景连续型随机变量的概率密度定义性质若存在非负函数fx,使得随机变量X的分布函数Fx可表示为Fx=∫_{-2非负性fx≥0;规范性∫_{-∞}^x ftdt,则称fx为X的概率密度函∞}^{+∞}fxdx=1数与分布函数关系概率计算若Fx可导,则fx=Fx区间概率PaX≤b=∫_a^b fxdx概率密度函数是描述连续型随机变量概率分布的重要工具与离散型随机变量不同,连续型随机变量取任一特定值的概率为零,即PX=a=0区间概率等于概率密度函数在该区间上的积分均匀分布定义分布函数随机变量X服从区间[a,b]上的均匀分均匀分布的分布函数为布,记为X~Ua,b,若其概率密度函Fx=0,xa;数为Fx=x-a/b-a,a≤xb;fx=1/b-a,x∈[a,b];fx=0,Fx=1,x≥bx∉[a,b]数字特征期望EX=a+b/2方差DX=b-a²/12均匀分布是最简单的连续型分布,它表示随机变量在给定区间内取任意值的概率密度相等均匀分布常用于模拟[a,b]区间上的随机选点,或者用作其他分布的近似当没有任何先验信息表明某些值比其他值更可能出现时,均匀分布是合理的选择指数分布定义无记忆性应用与数字特征随机变量X服从参数为λλ0的指数分布,指数分布的独特性质是无记忆性指数分布常用于描述随机事件之间的等待记为X~Expλ,若其概率密度函数为时间,如电话呼叫之间的时间间隔、顾客PXs+t|Xs=PXt到达之间的时间、元件的寿命等这意味着,如果一个具有指数寿命的元件fx=λe^-λx,x0;fx=0,x≤0期望EX=1/λ已经使用了s个单位时间仍然正常工作,其分布函数为那么它再工作t个单位时间的概率与全新方差DX=1/λ²元件工作t个单位时间的概率相同Fx=1-e^-λx,x0;Fx=0,x≤0正态分布主要性质广泛应用对称性密度函数关于x=μ对称正态分布在自然科学、社会科学和工程线性变换若X~Nμ,σ²,则技术中有广泛应用aX+b~Naμ+b,a²σ²•测量误差可加性若X₁~Nμ₁,σ₁²,X₂~Nμ₂,σ₂²且X₁,X₂独立,则•自然现象X₁+X₂~Nμ₁+μ₂,σ₁²+σ₂²•社会经济指标参数意义密度函数μ决定分布的位置(中心)X~Nμ,σ²的概率密度函数为σ决定分布的尺度(分散程度)fx=1/σ√2π·e^-x-μ²/2σ²,x∈R期望EX=μ,方差DX=σ²231标准正态分布定义正态化变换标准正态分布是均值μ=0,方差若X~Nμ,σ²,则Z=X-σ²=1的正态分布,记为N0,1若μ/σ~N0,1这一变换称为正态随机变量Z服从标准正态分布,其化变换,它将任意正态分布转化为概率密度函数为fz=标准正态分布,便于统一计算概率1/√2π·e^-z²/2,z∈R查表方法标准正态分布的分布函数Φz=PZ≤z通常使用标准正态分布表查询利用标准正态分布的对称性,可以计算任意区间的概率Pa≤Z≤b=Φb-Φa标准正态分布是最重要的连续型分布之一,也是统计分析和推断的基础通过标准正态分布表,可以方便地计算任意正态分布的概率标准正态分布的68-95-
99.7法则指出约68%的值落在μ±σ范围内,约95%的值落在μ±2σ范围内,约
99.7%的值落在μ±3σ范围内随机变量函数的分布离散型随机变量函数连续型随机变量函数若X是离散型随机变量,Y=gX是X的函数,则Y的分布律可通过若X是连续型随机变量,Y=gX是X的严格单调函数,则Y的概率以下步骤确定密度函数可通过变量变换公式确定•确定Y的所有可能取值y_j若gx严格单调增,则f_Yy=f_Xg^-1y|dx/dy|,其中g^-1是g的反函数,dx/dy是x=g^-1y时的导数•对每个y_j,找出使gx=y_j的所有x值•计算PY=y_j=∑PX=x,其中求和是对所有满足gx=y_j的x若gx严格单调减,则f_Yy=f_Xg^-1y|dx/dy|进行的对于一般情况,可以先求出Y的分布函数F_Yy=PY≤y=PgX≤y,然后通过求导得到概率密度函数f_Yy=F_Yy对于非单调函数,需要将定义域分解为若干个gx单调的区间,分别处理后合并结果二维随机变量联合分布函数Fx,y=PX≤x,Y≤y离散型联合分布律PX=x_i,Y=y_j=p_{ij}连续型联合密度函数Fx,y=∫_{-∞}^x∫_{-∞}^y fu,vdudv二维随机变量是指由两个随机变量组成的向量X,Y其概率分布通过联合分布函数完全确定联合分布函数Fx,y具有以下性质
1.单调性若x₁≤x₂,y₁≤y₂,则Fx₁,y₁≤Fx₂,y₂;
2.有界性0≤Fx,y≤1,F-∞,y=Fx,-∞=0,F+∞,+∞=1;
3.右连续性Fx+0,y+0=Fx,y;
4.概率计算Px₁边缘分布边缘分布函数离散型边缘分布律二维随机变量X,Y的边缘分布函数是指若X,Y是离散型随机变量,其联合分布单个变量的分布函数律为PX=x_i,Y=y_j=p_{ij},则F_Xx=PX≤x=Fx,+∞PX=x_i=∑_j p_{ij}(对所有可能的j求和)F_Yy=PY≤y=F+∞,yPY=y_j=∑_i p_{ij}(对所有可能的i求和)连续型边缘密度函数若X,Y是连续型随机变量,其联合密度函数为fx,y,则f_Xx=∫_{-∞}^{+∞}fx,ydyf_Yy=∫_{-∞}^{+∞}fx,ydx边缘分布描述了二维随机变量中单个变量的概率分布,它是通过对另一个变量积分掉(连续情况)或求和掉(离散情况)得到的边缘分布可以从联合分布中导出,但反之则不一定可行——仅知道边缘分布通常不足以确定联合分布条件分布离散型条件分布连续型条件分布条件概率计算对于离散型随机变量X,Y,已知Y=y_j的对于连续型随机变量X,Y,已知Y=y的条通过条件分布可以计算条件概率条件下,X的条件分布律为件下,X的条件概率密度函数为对于离散情况PX∈A|Y=y=PX=x_i|Y=y_j=f_{X|Y}x|y=fx,y/f_Yy∑_{x_i∈A}PX=x_i|Y=yPX=x_i,Y=y_j/PY=y_j=其中fx,y是联合密度函数,f_Yy是Y的对于连续情况PX∈A|Y=y=∫_Ap_{ij}/p_{·j}边缘密度函数,且要求f_Yy0f_{X|Y}x|ydx其中p_{·j}=PY=y_j=∑_i p_{ij},且要求PY=y_j0随机变量的独立性定义离散型随机变量的独立性随机变量X和Y相互独立,是指对离散型随机变量X和Y独立的充要任意实数x和y,事件{X≤x}和条件是对任意i,j有{Y≤y}相互独立,即PX=x_i,Y=y_j=PX≤x,Y≤y=PX≤x·PY≤y PX=x_i·PY=y_j用分布函数表示Fx,y=F_Xx·F_Yy连续型随机变量的独立性连续型随机变量X和Y独立的充要条件是对几乎所有x,y有fx,y=f_Xx·f_Yy随机变量的独立性是概率论中的重要概念,它表示一个变量的取值不会影响另一个变量的概率分布独立性与不相关性是不同的概念独立随机变量必然不相关,但不相关的随机变量不一定独立只有在正态分布的情况下,不相关性与独立性才是等价的数学期望离散型随机变量离散型随机变量X的数学期望定义为EX=∑x_i·PX=x_i其中求和是对X的所有可能取值进行的,要求上述级数绝对收敛连续型随机变量连续型随机变量X的数学期望定义为EX=∫_{-∞}^{+∞}x·fxdx其中fx是X的概率密度函数,要求上述积分绝对收敛随机变量函数的期望若Y=gX是X的函数,则离散情况EY=EgX=∑gx_i·PX=x_i连续情况EY=EgX=∫_{-∞}^{+∞}gx·fxdx数学期望(均值)是描述随机变量集中趋势的重要特征,它表示随机变量取值的平均水平从物理意义上看,数学期望相当于随机变量概率分布的重心并非所有随机变量都存在数学期望,例如柯西分布就没有有限的期望值数学期望的性质数学期望具有以下重要性质
1.线性性EaX+bY=aEX+bEY,其中a、b为常数这一性质对任意随机变量都成立,不要求X和Y独立
2.乘积期望若X和Y相互独立,则EXY=EX·EY这一性质要求随机变量独立,否则可能不成立
3.常数性质若X为常数c,则EX=c
4.可加性EX₁+X₂+...+X=EX₁+EX₂+...+EX,这是线性性的推广ₙₙ方差DX E[X-EX²]方差定义定义式随机变量X的方差是X与其期望值差的平方的度量随机变量偏离期望值的程度期望EX²-[EX]²计算公式通常使用这一公式简化计算方差是描述随机变量分散程度的重要特征,它表示随机变量取值与期望的偏离程度方差越大,表示随机变量的取值越分散,波动性越大;方差越小,表示取值越集中在期望附近方差的平方根称为标准差,它与方差具有相同的含义,但单位与随机变量相同,便于直观理解对于某些分布(如正态分布),标准差有特殊的概率意义方差的性质非负性平移不变性尺度变换方差总是非负的DX≥0常数加减不改变方差方差的尺度变换DaX=当且仅当X为常数(或以概DX+c=DX,其中c为常a²DX,其中a为常数这率1为常数)时,DX=0数这表明随机变量整体平表明随机变量尺度扩大a倍,移不影响其分散程度其方差扩大a²倍可加性若X和Y相互独立,则DX+Y=DX+DY这一性质可推广到任意有限个相互独立的随机变量协方差定义性质意义随机变量X和Y的协方差定义为协方差具有以下性质协方差反映两个随机变量的线性相关程度CovX,Y=E[X-EXY-EY]•对称性CovX,Y=CovY,X•CovX,Y0正相关,X增大,Y也•线性性CovaX+b,cY+d=协方差可用以下公式计算倾向于增大ac·CovX,Y,其中a,b,c,d为常数CovX,Y=EXY-EXEY•CovX,Y0负相关,X增大,Y倾•自协方差CovX,X=DX向于减小•独立性若X和Y独立,则CovX,Y=•CovX,Y=0不相关,X和Y之间没0有线性相关关系相关系数矩原点矩随机变量X的k阶原点矩定义为EX^k,k=1,2,3,...一阶原点矩就是数学期望EX中心矩随机变量X的k阶中心矩定义为E[X-EX^k],k=1,2,3,...二阶中心矩就是方差DX高阶矩的应用三阶中心矩用于计算偏度系数,表示分布的偏斜程度四阶中心矩用于计算峰度系数,表示分布的尖峭程度矩是描述概率分布的重要数字特征低阶矩(如一阶和二阶矩)描述分布的位置和分散度,高阶矩(如三阶和四阶矩)描述分布的形状特征对于正态分布,其所有奇数阶中心矩均为0(分布对称),四阶中心矩等于3倍的方差平方其他分布与正态分布的偏离程度可以通过比较高阶矩来度量特征函数定义性质随机变量X的特征函数定义为特征函数具有以下重要性质φ_Xt=Ee^{itX}=∫_{-∞}^{+∞}•φ_X0=1e^{itx}fxdx(连续型)•|φ_Xt|≤1φ_Xt=Ee^{itX}=∑_k e^{itx_k}p_k(离•φ_Xt是均匀连续的散型)•φ_X-t=φ_Xt的共轭复数其中i是虚数单位,t是实数参数应用特征函数的主要应用包括•唯一确定概率分布•计算随机变量的矩•推导和证明极限定理•处理随机变量的和与卷积特征函数是随机变量的一种重要表示方式,它与概率分布一一对应,是研究随机变量及其分布的有力工具通过特征函数,可以简化许多概率问题的处理,尤其是涉及随机变量和的分布计算大数定律切比雪夫大数定律1设随机变量序列X₁,X₂,...,X相互独立,且具有相同的期望μ和有限方差σ²ₙ收敛结论样本均值Y̅=X₁+X₂+...+X/n依概率收敛于μₙₙ数学表述3对任意ε0,有lim_{n→∞}P|Y̅-μ|ε=1ₙ切比雪夫大数定律揭示了大量独立重复观测的平均值稳定于期望值的现象它是理解统计规律性的基础定理,表明虽然单个随机事件难以预测,但大量随机事件的平均结果却表现出确定性的趋势这个定理不要求随机变量同分布,只需独立且有有限方差,具有广泛的适用性它是通过切比雪夫不等式证明的,反映了较弱的概率收敛大数定律(续)伯努利大数定律辛钦大数定律设n是n次伯努利试验中事件A发生的次数,p是每次试验中事件设随机变量序列X₁,X₂,...,X,...相互独立同分布,且具有有限ₙₙA发生的概率,则对任意ε0,有期望μ=EX₁,则对任意ε0,有lim_{n→∞}P|n/n-p|ε=1lim_{n→∞}P|Y̅-μ|ε=1ₙₙ这表明当试验次数n很大时,事件A发生的频率n/n几乎肯定与辛钦大数定律是对切比雪夫大数定律的加强,它仅要求随机变量ₙ概率p非常接近伯努利大数定律为频率概念提供了理论基础具有有限期望,而不需要有限方差这个定律广泛应用于抽样理论和实际统计中大数定律是概率论中的基本极限定理之一,它阐述了当样本容量增大时,样本统计量趋于稳定并接近总体参数的规律除了上述定律外,还有科尔莫哥洛夫强大数定律,它给出了几乎必然收敛的更强结论中心极限定理林德伯格列维中心极限定理标准化和-设随机变量序列X₁,X₂,...,X相互独1令S=X₁+X₂+...+X,则S-ₙₙₙₙ立同分布,具有期望μ和方差σ²02nμ/σ√n的分布函数近似于标准正态分布重要应用数学表述为大样本统计推断提供了理论基础,解释4lim_{n→∞}PS-nμ/σ√n≤x=了正态分布在自然和社会现象中的普遍性3ₙΦx,其中Φx是标准正态分布函数中心极限定理是概率论中最重要的定理之一,它解释了为什么许多自然和社会现象呈现正态分布根据该定理,无论个体随机变量的分布如何,只要满足一定条件,大量独立随机变量之和的分布都会近似于正态分布棣莫弗拉普拉斯定理-棣莫弗-拉普拉斯定理是中心极限定理的特例,专门用于二项分布的正态近似设随机变量X~Bn,p服从参数为n和p的二项分布,则当n足够大时,X的分布函数可以用正态分布函数近似Pa≤X≤b≈Φb+
0.5-np/√npq-Φa-
0.5-np/√npq其中q=1-p,Φx是标准正态分布函数注意,使用连续的正态分布近似离散的二项分布时,需要进行连续性校正,即将整数边界a和b分别修正为a-
0.5和b+
0.5一般来说,当n足够大且p不太接近0或1时(通常np5且nq5),这种近似效果较好参数估计点估计区间估计点估计是用样本统计量的单一数值来估计总体参数通常采用样区间估计是给出一个区间,使得总体参数以一定的置信度落在这本均值估计总体均值,样本方差估计总体方差点估计方法包括个区间内区间估计由以下要素构成•置信区间总体参数可能的取值范围•矩估计法•置信度参数落在区间内的概率,通常用1-α表示•最大似然估计法•置信限区间的上下界•最小二乘估计法常见的置信度为
0.95(95%)或
0.99(99%)点估计需要评价的性质包括无偏性、有效性和一致性等参数估计是统计推断的基本问题之一,它关注如何基于样本数据推断总体的分布参数合理的参数估计对于科学研究、质量控制和决策制定具有重要意义在进行参数估计时,需要考虑样本的代表性和估计方法的适用条件矩估计法基本原理步骤矩估计法的核心思想是用样本矩估计总体矩,然后•建立总体矩与待估参数之间的关系式根据总体矩与参数之间的关系求解参数•计算样本矩通常用样本k阶矩m_k=1/n∑_{i=1}^n X_i^k估计•用样本矩替换关系式中的总体矩总体k阶矩EX^k•求解方程得到参数估计值优缺点优点•计算简单•适用范围广•不需要知道总体分布的具体形式缺点•估计效率可能不高•高阶矩估计可能不稳定•矩不一定存在矩估计法是一种简便的参数估计方法,由统计学家卡尔·皮尔逊提出对于具有单个参数的分布,只需用一阶样本矩(样本均值)估计;对于具有两个参数的分布,通常需要一阶和二阶样本矩(样本均值和样本方差)最大似然估计法特点与应用求解过程最大似然估计具有不变性、渐近有效性和渐似然函数构造求Lθ或ln Lθ关于θ的导数,并令其等于近正态性等良好性质,在统计推断中广泛应基本原理对于参数为θ的分布,n个独立同分布的观0用最大似然估计法的核心思想是选择参数值,测值x₁,x₂,...,x的似然函数为ₙd/dθln Lθ=0使得观测到当前样本的概率最大这个概率Lθ=fx₁,x₂,...,x|θ=∏_{i=1}^n fx_i|θ函数称为似然函数ₙ解得的θ值即为最大似然估计值θ̂为确保极其中f是概率密度函数或概率质量函数通大值,需要检验二阶导数是否为负常使用对数似然函数ln Lθ简化计算最大似然估计是一种重要的参数估计方法,由统计学家R.A.费舍尔提出它基于似然原则,在大样本条件下具有优良的统计性质对于许多常见分布,最大似然估计值有简单的解析表达式;对于复杂模型,可能需要数值方法求解区间估计样本数据构造置信区间解释置信度收集具有代表性的样本观测值利用样本统计量构造区间估计1-α的置信度表示多次重复该过程,约有1-α×100%的区间包含真参数区间估计是用一个区间[L,U]估计未知参数θ的方法,其中L和U称为置信下限和置信上限置信区间的构造通常基于样本统计量的分布常见的置信区间包括
1.正态总体均值的置信区间基于t分布或z分布,取决于方差是否已知和样本量大小
2.正态总体方差的置信区间基于χ²分布
3.两个正态总体均值差的置信区间基于t分布,分为独立样本和配对样本两种情况
4.二项分布成功概率p的置信区间可基于正态近似或精确方法假设检验提出假设原假设H₀待检验的假设,通常表示无效应或无差异备择假设H₁与原假设相对的假设,表示有效应或有差异构造检验统计量基于样本数据计算能反映检验目的的统计量,并确定其在H₀下的分布确定拒绝域根据显著性水平α,确定拒绝原假设的临界值作出决策比较检验统计量与临界值,决定是否拒绝原假设计算P值,表示在原假设成立下观察到当前或更极端结果的概率正态总体均值的检验单个正态总体均值检验σ²已知的情况假设X₁,X₂,...,X是来自正态总体检验统计量z=X̄-μ₀/σ/√n~ₙNμ,σ²的随机样本N0,1检验假设H₀:μ=μ₀vs.H₁:μ≠μ₀在显著性水平α下或μμ₀,μμ₀双侧检验当|z|z_{α/2}时拒绝H₀单侧检验当zz_α或z-z_α时拒绝H₀σ²未知的情况检验统计量t=X̄-μ₀/S/√n~tn-1在显著性水平α下双侧检验当|t|t_{α/2}n-1时拒绝H₀单侧检验当tt_αn-1或t-t_αn-1时拒绝H₀t检验是最常用的统计检验方法之一,适用于样本量较小的情况当样本量n较大时(通常n30),t分布近似于标准正态分布,两种方法的结果近似相同检验过程中需要注意的是检验的单侧性或双侧性,这取决于实际问题的性质正态总体方差的检验单个正态总体方差检验拒绝域应用注意事项假设X₁,X₂,...,X是来自正态总体在显著性水平α下χ²检验对正态性假设很敏感,应确保样本ₙNμ,σ²的随机样本来自正态总体双侧检验当χ²χ²_{1-α/2}n-1或χ²检验假设H₀:σ²=σ₀²vs.H₁:σ²≠χ²_{α/2}n-1时拒绝H₀由于卡方分布不对称,双侧检验的拒绝域σ₀²或σ²σ₀²,σ²σ₀²在两尾的临界值不同右侧检验当χ²χ²_αn-1时拒绝H₀检验统计量χ²=n-1S²/σ₀²~χ²n-1方差检验通常用于比较测量方法的精密度左侧检验当χ²χ²_{1-α}n-1时拒绝或评估生产过程的稳定性其中S²是样本方差,χ²n-1表示自由度为H₀n-1的卡方分布两个正态总体均值差的检验独立样本t检验假设X₁,X₂,...,X来自Nμ₁,σ₁²,Y₁,Y₂,...,Y来自Nμ₂,σ₂²,两样本相互独立ₙ₁ₙ₂检验假设H₀:μ₁=μ₂vs.H₁:μ₁≠μ₂或μ₁μ₂,μ₁μ₂当σ₁²=σ₂²=σ²(未知)时,检验统计量t=X̄-Ȳ/S_p√1/n₁+1/n₂~tn₁+n₂-2其中S_p²是合并样本方差S_p²=[n₁-1S₁²+n₂-1S₂²]/n₁+n₂-2配对t检验假设X₁,Y₁,X₂,Y₂,...,X,Y是n对配对观测值ₙₙ令D_i=X_i-Y_i,i=1,2,...,n,考察差值D_i的分布检验假设H₀:μ_D=0vs.H₁:μ_D≠0或μ_D0,μ_D0检验统计量t=D̄/S_D/√n~tn-1其中D̄是差值的样本均值,S_D是差值的样本标准差选择独立样本t检验还是配对t检验取决于样本的收集方式配对设计通常能减小变异性,提高检验效力当样本量较大或总体方差显著不同时,应考虑使用Welch修正的t检验或非参数方法方差分析模型目的X_{ij}=μ+α_i+ε_{ij},其中μ是总均1比较三个或更多总体的均值是否相等值,α_i是第i个处理效应,ε_{ij}是随机误差假设检验统计量H₀:α₁=α₂=...=α_k=0(各组均值F=MS_A/MS_E~Fk-1,n-k相等)3其中MS_A是组间均方,MS_E是组内均H₁:至少有一个α_i≠0(存在均值差异)方方差分析(ANOVA)是由R.A.费舍尔创立的统计方法,用于同时比较多个总体均值与多次进行t检验相比,方差分析可以控制整体的Ⅰ型错误率,提高检验效率单因素方差分析基于总变异的分解总平方和(SST)=组间平方和(SSA)+组内平方和(SSE)相关分析回归分析模型假设参数估计拟合优度Y_i=β₀+最小二乘估计判定系数R²=β₁X_i+ε_i,其β̂₁=∑X_i-SSR/SST=1-中ε_i是独立同分布X̄Y_i-Ȳ/∑X_i-SSE/SST的随机误差,服从X̄²β̂₀=Ȳ-β̂₁X̄R²表示回归解释的N0,σ²变异比例,取值在0到1之间统计推断斜率显著性检验H₀:β₁=0vs.H₁:β₁≠0检验统计量t=β̂₁/SEβ̂₁~tn-2非参数检验拟合优度检验独立性检验其他非参数检验χ²χ²拟合优度检验用于检验观测数据是否符χ²独立性检验用于检验两个分类变量是否非参数检验不依赖总体分布的假设,适用合某个理论分布相互独立范围广常见的还有假设观测频数为O₁,O₂,...,O_k,理假设观测频数为O_{ij},理论频数E_{ij}•符号检验检验中位数论频数为E₁,E₂,...,E_k=行和×列和/总和•秩和检验比较两个总体检验假设H₀:数据符合理论分布vs.检验假设H₀:两变量独立vs.H₁:两变•游程检验检验随机性H₁:数据不符合理论分布量不独立检验统计量χ²=∑O_i-E_i²/E_i~检验统计量χ²=∑∑O_{ij}-χ²k-1-m E_{ij}²/E_{ij}~χ²r-1c-1其中m是从数据估计的参数个数其中r是行数,c是列数常用概率不等式马尔可夫不等式对于任意非负随机变量X和正数a,有PX≥a≤EX/a该不等式仅要求随机变量非负且期望存在,适用范围广但界限较宽松切比雪夫不等式对于具有有限期望μ和有限方差σ²的随机变量X,对任意正数ε,有P|X-μ|≥ε≤σ²/ε²联合正态分布定义性质随机向量X,Y服从二维正态分布,如二维正态分布的主要性质包括果其概率密度函数为•边缘分布X~Nμ₁,σ₁²,fx,y=1/2πσ₁σ₂√1-Y~Nμ₂,σ₂²ρ²·exp{-1/21-ρ²[x-•条件分布X|Y=y~μ₁²/σ₁²-2ρx-μ₁y-Nμ₁+ρσ₁y-μ₂/σ₂,μ其₂中/μ₁σ₁,μ₂σ₂是均+值y,-μσ₂₁²²,/σσ₂₂²²是]}方•σ独₁立²性1-ρ²X和Y独立当且仅当ρ=0差,ρ是相关系数•线性组合对任意常数a,b,c,d,aX+bY和cX+dY的联合分布仍是二维正态分布多维推广二维正态分布可以推广到n维情况,称为多元正态分布其分布由均值向量μ和协方差矩阵Σ完全确定多元正态分布在多变量统计分析中有广泛应用总结与回顾知识体系构建从基础概念到高级定理的完整框架重要公式梳理2掌握核心计算工具和理论基础应用技巧3灵活运用公式解决实际问题的方法本课程系统回顾了概率论的核心内容,从基本概念到重要定理,构建了完整的知识体系通过掌握这些关键公式和理论,我们能够分析和解决各种随机现象问题概率论是现代数学的重要分支,也是数据科学、人工智能、金融工程等领域的基础深入理解概率论不仅有助于学术研究,也能提升我们在不确定性环境中的决策能力希望本课件能够帮助大家系统掌握概率论知识,并在实践中灵活应用。
个人认证
优秀文档
获得点赞 0