还剩58页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
概率理论复习课件欢迎参加概率理论复习课程本次课程将系统地回顾概率论的基本概念、定理和应用,帮助大家巩固知识点,为考试做好充分准备我们将从基础概念开始,逐步深入到复杂理论,并通过丰富的例题加深理解概率论作为现代数学的重要分支,不仅在理论研究中有重要地位,也在工程、经济、医学等众多领域有广泛应用希望通过本次复习,能够帮助大家建立完整的知识体系,掌握解决实际问题的方法课程概述课程目标学习内容全面复习概率论与数理统计包括概率论基础、随机变量的核心内容,夯实理论基础及其分布、多维随机变量、,提升解题能力,为期末考数字特征、大数定律与中心试和后续专业课程学习做好极限定理、数理统计基础、准备参数估计与假设检验等章节考核方式平时作业占,课堂参与占,期末考试占期末考试30%10%60%采用闭卷形式,考试时间为分钟,满分分120100第一章概率论基础应用领域广泛应用于金融、保险、医学等领域核心理论条件概率、全概率公式、贝叶斯公式基础概念随机试验、样本空间、事件、概率概率论的基础知识是整个理论体系的根基,理解这部分内容对于掌握后续章节至关重要本章将从最基本的概念入手,逐步构建概率论的理论框架,为后续学习打下坚实基础随机试验与样本空间
1.1随机试验的定义样本空间的概念随机试验是指在相同条件下可重复进行的试验,且试验结果不样本空间是随机试验所有可能结果的集合,通常用符号表示Ω能预先确定,但所有可能结果的集合是已知的样本空间中的元素称为样本点,表示随机试验的一个基本结果随机试验具有三个基本特征可重复性、随机性和可预测性其中可预测性是指虽然单次试验结果不确定,但大量重复时会根据样本点的多少,样本空间可分为有限样本空间、可数无限呈现一定的统计规律样本空间和不可数无限样本空间三种类型事件的概念与关系
1.2事件的定义基本事件和复合事件事件是样本空间的子集,表示随机基本事件是由样本空间中单个样本试验的某些结果的集合每次试验点组成的事件,是不可再分的最小,事件或者发生,或者不发生事件复合事件是由多个基本事件组成的必然事件样本空间本身事件,可以通过基本事件的组合来•Ω表示任何事件都可以表示为基本不可能事件空集•∅事件的并集随机事件介于必然事件与不•可能事件之间事件间的关系包含关系若发生必导致发生,则包含于,记为⊆A B A B A B相等关系若⊆且⊆,则A BB A A=B互不相容关系若A∩B=∅,则称A与B互不相容或互斥事件的运算
1.3并运算事件与的并,记为∪,表示、中至少有一个发生的事件A BA BA B交运算事件A与B的交,记为A∩B,表示A、B同时发生的事件差运算事件与的差,记为,表示发生但不发生的事件A BA-BA B互补运算事件的互补,记为或,表示不发生的事件AĀA^C A事件的运算满足交换律、结合律、分配律等性质理解事件间的运算关系,有助于复杂问题的分解与求解在实际应用中,常需要将复杂事件分解为简单事件的运算组合概率的定义
1.4古典概率几何概率频率概率公理化定义基于等可能性原理,事当样本点在某区域均匀基于大数定律,事件概率是定义在样本空间A件的概率为包分布时,事件的概率的概率为事件的事件域上的一个函A PA=AAPA=AΩ含的基本事件数样本空为所占区域的发生的频数试验总次数数,满足非负性、规/PA=A/P间中基本事件总数度量样本空间的度量(当试验次数趋于无穷范性和可列可加性三个Ω/Ω适用于有限样本空间且适用于连续样本空间大时)这是概率的统公理这是最一般的概各基本事件等可能的情的随机试验计定义率定义方式况概率的基本性质
1.5非负性对任意事件A,有PA≥0,即概率始终是非负的规范性必然事件的概率为1,即PΩ=1可列可加性对于互不相容的事件序列A₁,A₂,...,有PA₁∪A₂∪...=PA₁+PA₂+...推导性质•不可能事件的概率为0P∅=0•有限可加性有限个互不相容事件的并的概率等于各事件概率之和•互补事件的概率PĀ=1-PA•单调性若A⊆B,则PA≤PB•加法公式PA∪B=PA+PB-PA∩B条件概率
1.6条件概率的定义乘法公式在事件已发生的条件下,事件发生的概率,记作,由条件概率定义可直接推导出乘法公式BAPA|B计算公式为PA∩B=PB·PA|B=PA·PB|A,其中PA|B=PA∩B/PB PB0对于个事件,有n PA₁∩A₂∩...∩Aₙ=条件概率本身也是一种概率,满足概率的所有性质,如非负性PA₁·PA₂|A₁·PA₃|A₁∩A₂·...·PAₙ|A₁∩A₂∩...∩Aₙ₋₁、规范性和可列可加性条件概率是概率论中的核心概念,它反映了新信息对事件发生可能性判断的影响在实际应用中,许多问题都可转化为条件概率的计算全概率公式
1.7完备事件组计算各部分概率事件构成样本空间的一B₁,B₂,...,BₙΩ对每个,计算i PA∩Bᵢ=PBᵢ·PA|Bᵢ个划分,即它们互不相容且并集为Ω求和得到总概率应用扩展PA=PA∩B₁+PA∩B₂+...+可将复杂问题分解为简单条件概率计算PA∩Bₙ=∑PBᵢ·PA|Bᵢ全概率公式是分解复杂问题的有力工具,适用于当事件可以通过一组完备事件的分解来间接计算概率的情况通过划分样本空间为若A干个互不相容的部分,将问题化繁为简在实际应用中,全概率公式常用于解决分阶段随机试验或多条路径可能导致相同结果的概率计算问题贝叶斯公式
1.8ᵢᵢPB|A PB后验概率先验概率事件A发生后,对原因Bᵢ的重新评估事件A发生前,对原因Bᵢ的初始评估ᵢPA|B似然度若原因为Bᵢ,结果A的发生概率贝叶斯公式是条件概率的一个重要应用,它建立了已知结果通过似然度推断原因的数学模型其核心思想是利用新信息更新对事件的概率判断公式表达为PBᵢ|A=[PBᵢ·PA|Bᵢ]/[∑PBⱼ·PA|Bⱼ]贝叶斯公式广泛应用于医疗诊断、垃圾邮件过滤、机器学习、模式识别等领域,是现代统计学和人工智能的基础事件的独立性
1.9定义和判断多事件的独立性若,则称事对于个事件,相互独立意味着PA∩B=PA·PB n件与相互独立独立性是一种任意子集的交事件的概率等于各AB概率关系,而非逻辑关系事件概率的乘积事件独立的充要条件注意两两独立不一定意味着相PA|B=或(当相关互独立,需检验所有组合的独立PA PB|A=PB概率非零时)性独立重复试验若多次试验的结果相互独立且各次试验中事件发生的概率相同,则称为独立重复试验在次独立重复试验中,事件恰好发生次的概率n Ak P=Cn,k·p^k·1-,其中为单次试验中发生的概率p^n-k pA第二章随机变量及其分布随机变量的定义将样本空间映射到实数集的函数分布函数完整描述随机变量概率分布的函数离散型随机变量概率分布由分布律表示连续型随机变量概率分布由概率密度函数表示常见分布掌握重要分布的特征和应用随机变量的概念
2.1随机变量的定义离散型随机变量连续型随机变量随机变量是定义在样本空间上的实值若随机变量的可能取值是有限个或可若存在非负函数,使得对任意实数ΩX fx x函数,将每个样本点∈映射到一个列无限多个,则称为离散型随机变量,有,则称为ωΩX PX≤x=∫₍₋∞,ₓ₎ftdt X实数其概率分布可用分布律表示连续型随机变量,为的概率密度Xωfx X函数随机变量的引入使我们能够用数量化的常见的离散型随机变量包括二项分布方式描述随机现象,便于数学处理随、泊松分布、几何分布、超几何分布等常见的连续型随机变量包括均匀分布机变量通常用大写字母、、等表示、指数分布、正态分布等X YZ,其取值用相应的小写字母表示分布函数
2.2定义随机变量X的分布函数定义为Fx=PX≤x,表示随机变量X的取值不超过x的概率性质•单调不减若x₁x₂,则Fx₁≤Fx₂•有界性0≤Fx≤1•右连续性Fx+0=Fx•极限性质F-∞=0,F+∞=1概率计算PaX≤b=Fb-FaPX=a=Fa-Fa-0分布类型离散型阶跃函数连续型光滑曲线混合型部分阶跃部分光滑离散型随机变量的分布律
2.3随机变量X x₁x₂...xₙ...概率PX=xᵢp₁p₂...pₙ...离散型随机变量的分布律是指随机变量的所有可能取值及其相应概率的对应关系,通常可以用上表表示,其中分布律满足两个条件pᵢ=PX=xᵢ所有非负;所有的和为
①pᵢ
②pᵢ1分布律表示方法灵活,除了表格形式外,也可用解析式表示,如对于已知分布律的离散型随机变量,其分布函数可以表示为PX=k=fk Fx,是一个阶跃函数=∑_{xᵢ≤x}PX=xᵢ在实际应用中,分布律的确定通常基于具体问题的分析和已有的统计数据连续型随机变量的概率密度
2.4概率密度函数的定义概率密度的性质若存在非负函数,使得对任意非负性fx•fx≥0实数,有,x Fx=∫₍₋∞,ₓ₎ftdt归一性•∫₍₋∞,₊∞₎fxdx=1则称为随机变量的概率密度fx X概率计算•Pa≤X≤b=函数∫₍ₐ,b₎fxdx概率密度函数表示随机变量落在不连续点处的关系•Fx=fx同区域的概率密集程度,不同于概率本身几何意义概率等于概率密度曲线下对应区域的面积单点的概率密度可能大于,但单1点的概率始终为0若是连续型随机变量,则对任意固定值,有,因此X aPX=a=0PaX≤b=Pa≤X≤b=Pa≤Xb=PaXb常见离散分布
(一)
2.5二项分布泊松分布Bn,p Pλ在次独立重复试验中,每次试验成功的概率为,随机变量描述单位时间(或空间)内随机事件发生的次数n pX表示成功的总次数分布律,,其中PX=k=λ^k·e^-λ/k!k=0,1,2,...λ0分布律,是参数PX=k=Cn,k·p^k·1-p^n-k k=0,1,...,n数学期望数学期望EX=np EX=λ方差方差DX=np1-p DX=λ应用质量控制、成功失败的试验序列应用排队理论、稀有事件计数/注当大小且时,二项分布可以用泊松分布近似n pnp=λ常见离散分布
(二)
2.6几何分布超几何分布在一系列独立重复试验中,首次成功出现时所需的试验次数X服从几何分从N个物体中(包含M个特殊物体)不放回地抽取n个,其中特殊物体的布若每次试验成功概率为p,则分布律为PX=k=1-p^k-1·p,数量X服从超几何分布分布律为PX=k=[CM,k·CN-M,n-k=1,2,...k]/CN,n,max0,n-N-M≤k≤minn,M几何分布具有无记忆性PXm+n|Xm=PXn期望为EX=期望为EX=n·M/N,方差为DX=n·M/N·1-M/N·N-n/N-11/p,方差为DX=1-p/p²当N很大时,超几何分布可近似为二项分布Bn,M/N常见连续分布
(一)
2.7均匀分布指数分布Ua,b Expλ随机变量在区间上等可能地取值,概率密度函数为描述独立事件之间的等待时间,概率密度函数为X[a,b],;,其他,;,,其中fx=1/b-a a≤x≤b fx=0fx=λe^-λx x0fx=0x≤0λ0分布函数为分布函数为,;,;,,;,Fx=0xa Fx=x-a/b-a a≤x≤b Fx=1Fx=0x≤0Fx=1-e^-λxx0xb期望,方差EX=1/λDX=1/λ²期望,方差EX=a+b/2DX=b-a²/12特点无记忆性PXs+t|Xs=PXt应用随机数生成、简单随机化应用寿命分析、可靠性理论、排队系统常见连续分布
(二)
2.8x值标准正态密度函数值随机变量函数的分布
2.9离散型随机变量函数若是离散型随机变量,,则的分布律可以通过求出的所有可能取值及对应概率得到X Y=gX Y Y连续型随机变量函数若是连续型随机变量,,求的分布的方法有分布函数法、概率密度函数法和随机2X Y=gX Y变量变换技术常用变换线性变换若~,则~;若~X Nμ,σ²aX+b Naμ+b,a²σ²X,则~ExpλaX Expλ/aa0随机变量函数的分布是概率论中的重要内容,它研究随机变量经过某种变换后的概率分布特征在实际应用中,我们经常需要研究观测量的非线性函数的分布,如平方、对数、三角函数等对于单调函数,若的密度为,则的密度可通过公式计算,其中是的反函数对于非单调函数gx X fxx Y=gX fyy=fxg⁻¹y|dg⁻¹y/dy|g⁻¹g,需将定义域分段处理第三章多维随机变量及其分布相关性分析研究随机变量间的依赖关系1条件分布在一个随机变量已知的条件下,另一个的分布联合分布3同时描述多个随机变量取值的概率规律多维随机变量研究多个随机变量的联合统计特性,是概率论的重要内容本章主要讨论二维随机变量的分布特征、边缘分布、条件分布和独立性等概念,并介绍二维正态分布的性质这些理论在多因素分析和随机过程研究中有重要应用二维随机变量的概念
3.1二维随机变量的定义联合分布函数边缘分布函数二维随机变量是指由两个随机变二维随机变量的联合分布函数定二维随机变量中单个变量的分布X,Y X,Y X,Y X量和构成的向量,表示随机试验的义为函数称为的边缘分布函数,记为X YX两个数量指标,表示事件Fx,y=PX≤x,Y≤y Fₓx=PX≤x=PX≤x,Y∞=二维随机变量的可能取值构成平面上的发生的概率{X≤x,Y≤y}Fx,∞点集,这些点出现的概率分布称为二维性质,同理,的边缘分布函数为
①F-∞,y=Fx,-∞=0Y Fᵧy=随机变量的分布;关于和分别F∞,∞=1
②Fx,y xy PY≤y=PX∞,Y≤y=F∞,y单调不减;关于和分别右
③Fx,y xy连续;对任意矩形区域,
④Px₁离散型二维随机变量
3.3连续型二维随机变量X,Y的联合概率密度函数fx,y满足
①fx,y≥0;
②∫∫fx,ydxdy=1在整个平面上积分;
③对于任意平面区域D,PX,Y∈D=∫∫[D]fx,ydxdy边缘概率密度函数是指单个随机变量的密度函数,可由联合密度函数通过积分求得X的边缘密度为fₓx=∫fx,ydy,Y的边缘密度为fᵧy=∫fx,ydx在实际应用中,常见的连续型二维随机变量包括二维均匀分布、二维正态分布等几何上,联合密度函数可视为三维空间中的曲面,其在某区域D上的体积等于X,Y落在D内的概率条件分布
3.4离散型条件分布连续型条件分布对于离散型二维随机变量,已知时的条件分布律为对于连续型二维随机变量,已知时的条件密度函数为X,Y Y=y XX,YY=y XPX=x|Y=y=PX=x,Y=y/PY=y=pₓᵧ/p·ᵧ,其中PY=y0fx|y=fx,y/fᵧy,其中fᵧy0类似地可定义已知X=x时类似地可定义已知时的条件分布律的条件密度函数X=x YY条件分布的性质应用条件分布具有概率分布的所有性质例如,且条件分布在统计推断、贝叶斯分析和预测模型中有重要应用通fx|y≥0条件分布可以看作是在新的样本空间上定义的概率过条件分布,可以研究一个随机变量在另一个随机变量已知条件∫fx|ydx=1分布,可用于计算条件概率下的不确定性随机变量的独立性
3.5独立性的定义独立性的判断若对于任意实数x和y,满足Fx,y=判断独立性的方法Fₓx·Fᵧy,则称随机变量X与Y相互独立•检验定义是否满足独立性的等价表述•计算条件分布是否与边缘分布相同•对离散型PX=x,Y=y=•检查协方差或相关系数是否为零(注意PX=x·PY=y零相关不一定意味着独立)•对连续型fx,y=fₓx·fᵧy•对任意可测集A和B PX∈A,Y∈B=PX∈A·PY∈B独立性的性质若X和Y独立,则•gX和hY也独立(g、h为任意函数)•EXY=EX·EY•DX+Y=DX+DY•M[X+Y]t=M[X]t·M[Y]t(矩母函数的乘积性质)二维正态分布
3.6相关系数ρ分布形状第四章随机变量的数字特征随机变量的数字特征是用数值来描述随机变量分布特点的重要工具它们能够简洁地刻画随机变量的集中趋势、离散程度、对称性和相关性等本章将讨论数学期望、方差、协方差、相关系数等常用数字特征,以及矩和矩母函数的基本理论数字特征通常比完整的概率分布更容易获取和理解,在统计分析和应用中有着广泛的用途掌握这些概念对理解随机现象的统计规律至关重要数学期望
4.1离散型随机变量的期望连续型随机变量的期望随机变量函数的期望若为离散型随机变量,取值为若为连续型随机变量,密度函数为若是的函数,则X x₁,x₂,...X Y=gX X,对应的概率为,则的数学,则的数学期望定义为p₁,p₂,...XfxX(离散型)EY=EgX=∑ᵢgxᵢpᵢ期望(均值)定义为EX=∫xfxdx(连续型EY=EgX=∫gxfxdxEX=∑ᵢxᵢpᵢ=x₁p₁+x₂p₂+...当积分收敛时,上述定义有)∫|x|fxdx当无穷级数收敛时,上述定义有意义∑|xᵢ|pᵢ对于二元函数,有类似的公Z=gX,Y意义式数学期望表示随机变量取值的平均水平,是描述随机变量集中趋势的特征量期望具有线性性质EaX+bY=aEX+bEY若与独立,则有X YEXY=EX·EY方差
4.2定义随机变量X的方差定义为其与期望偏离的平方的均值DX=VarX=E[X-EX²]方差的计算公式DX=EX²-[EX]²标准差定义为方差的算术平方根σX=√DX性质方差的性质DC=0(常数的方差为零);DaX+b=a²DX(线性变换对方差的影响)若随机变量X和Y相互独立,则DX+Y=DX+DY和DX-Y=DX+DY一般情况DX+Y=DX+DY+2CovX,Y,其中CovX,Y为X和Y的协方差统计意义方差衡量随机变量的离散或变异程度,值越大表示数据分布越分散,与期望的偏离越大方差是概率论和统计学中用于度量随机变量或一组数据时间均值或空间均值的离散程度的度量常见分布的方差二项分布Bn,p DX=np1-p泊松分布PλDX=λ均匀分布Ua,b DX=b-a²/12指数分布ExpλDX=1/λ²正态分布Nμ,σ²DX=σ²协方差和相关系数
4.3协方差协方差定义CovX,Y=E[X-EXY-EY]计算公式CovX,Y=EXY-EXEY性质CovX,X=DX;CovX,Y=CovY,X;CovaX,bY=abCovX,Y线性性质CovX₁+X₂,Y=CovX₁,Y+CovX₂,Y若X与Y独立,则CovX,Y=0(注意反之不一定成立)相关系数相关系数定义ρX,Y=CovX,Y/[σXσY]性质-1≤ρX,Y≤1;|ρX,Y|=1当且仅当X与Y有线性关系Y=aX+ba≠0ρ=0表示X与Y不相关;ρ0表示正相关;ρ0表示负相关ρ的绝对值越接近1,线性相关性越强;越接近0,线性相关性越弱应用意义协方差和相关系数度量两个随机变量之间的线性相关程度在统计建模、金融分析、信号处理等领域有广泛应用相关系数克服了协方差的量纲问题,是一个无量纲的纯数,便于不同数据集的比较矩和矩母函数
4.4矩的定义矩母函数随机变量的阶原点矩定义为,随机变量的矩母函数定义为,为实数,当X kμₖ=EX^k k=1,2,...X Mt=Ee^tX t此期望存在时随机变量的阶中心矩定义为,X kνₖ=E[X-EX^k]k=1,2,...矩母函数的重要性质特别地,为均值,为方差μ₁=EXν₂=DX唯一性矩母函数唯一确定分布;
①原点矩与中心矩之间存在一定的换算关系例如,ν₂=μ₂-μ₁²,ν₃=μ₃-3μ₂μ₁+2μ₁³
②求导性M^k0=EX^k,即矩母函数在t=0处的k阶导数等于阶原点矩;k线性性若,则;
③Y=aX+b M[Y]t=e^bt·M[X]at独立随机变量和的矩母函数等于各矩母函数的乘积
④矩提供了描述随机变量分布形状的重要信息除了均值和方差外,三阶中心矩衡量分布的偏斜程度,四阶中心矩(通常用峰度表示)衡量分布尾部的厚度矩母函数是求解随机变量矩的有效工具,在导出分布的性质和处理随机变量变换问题时非常有用切比雪夫不等式
4.5定理表述几何意义推广形式对于任意随机变量X,若其期望EX和方差DX存切比雪夫不等式给出了随机变量偏离其期望的概率一般化切比雪夫不等式对于任意非负单调增函数在,则对于任意正数ε,有上界,表明方差越小,随机变量取值集中在期望附gx和正数ε,若E[g|X-EX|]存在,则近的概率越大P|X-EX|≥ε≤DX/ε²P|X-EX|≥ε≤E[g|X-EX|]/gε特别地,对于任意随机变量,其取值落在以期望为等价地,P|X-EX|ε≥1-DX/ε²常用的特例是取gx=x²,得到标准切比雪夫不等中心,以k个标准差为半径的区间内的概率至少为式1-1/k²切比雪夫不等式是概率论中的一个基本不等式,它提供了随机变量取值与其期望偏离程度的概率界限这个不等式的重要性在于它适用于任何具有有限方差的分布,不需要知道分布的具体形式切比雪夫不等式是大数定律的理论基础,对于理解随机变量的集中趋势具有重要意义在应用统计和风险分析中,它提供了估计概率界限的有力工具第五章大数定律和中心极限定理随机试验样本均值进行大量独立重复的随机试验计算观测结果的算术平均值分布近似收敛性质样本均值的分布趋于正态分布(中心极限样本均值趋于理论期望(大数定律)定理)大数定律和中心极限定理是概率论中两个最基本也最重要的定理大数定律揭示了随机现象在大量重复试验中表现出的稳定性,而中心极限定理则揭示了大量独立随机因素的综合效应近似服从正态分布的普遍规律这两个定理为统计推断提供了理论基础,也是理解随机变量的极限行为和统计规律的关键它们在科学研究、工程技术、金融经济等领域都有广泛的应用大数定律
5.1切比雪夫大数定律1设X₁,X₂,...,Xₙ是相互独立的随机变量序列,如果它们具有相同的期望μ和有界的方差,则对于任意ε0,有lim[n→∞]P|X₁+X₂+...+Xₙ/n-μ|ε=1伯努利大数定律在n次独立重复的伯努利试验中,如果每次试验成功的概率为p,成功次数为nₙ,则对于任意ε0,有lim[n→∞]P|nₙ/n-p|ε=1辛钦大数定律设X₁,X₂,...,Xₙ是独立同分布的随机变量序列,如果EX₁=μ存在,则对于任意ε0,有lim[n→∞]P|X₁+X₂+...+Xₙ/n-μ|ε=1大数定律是概率论中描述大量重复试验的平均结果趋于稳定的定理族它表明,随着试验次数的增加,样本均值以概率1收敛于期望值这个定理解释了为什么概率可以通过相对频率来估计,也是统计推断的理论基础之一大数定律的不同形式对独立性、同分布性和矩的存在性有不同的要求,但它们揭示的基本规律是相同的大量观测的平均结果会表现出一种稳定性大数定律的应用
5.2频率稳定性蒙特卡洛方法统计质量控制根据伯努利大数定律,在大量独立重复试验中蒙特卡洛方法是基于大数定律的计算技术,通在工业生产中,大数定律支持了统计质量控制,事件发生的频率会稳定在该事件的概率附近过随机抽样来近似求解复杂的数学问题例如的理论基础通过抽样检查产品的质量特性,这解释了为什么赌场长期总是盈利,保险公,可以通过在单位正方形内随机投点,然后计并应用统计方法,可以有效监控和改进生产过司能够准确计算保费,以及为什么统计调查能算落在内切圆内的点的比例,来近似计算的程,确保产品质量稳定在目标水平π够反映整体情况值控制图、抽样计划等质量管理工具的有效性都在实际应用中,我们可以通过观察大量试验中在高维积分、优化问题、物理模拟等领域,蒙建立在大数定律的基础上,使得我们能够从有事件发生的相对频率,来估计该事件的概率特卡洛方法提供了一种有效的数值解法,特别限的样本推断整体的质量水平这是频率学派统计方法的基础是对于那些难以用解析方法求解的问题中心极限定理
5.3样本量n均匀分布的和指数分布的和二项分布的和中心极限定理的应用
5.4正态分布的近似计统计推断物理学应用算中心极限定理是参数统布朗运动、热力学第二中心极限定理使我们可计推断的基础样本均定律、随机行走等物理以用正态分布近似计算值渐近服从正态分布的现象都可以通过中心极其他分布的概率例如性质使得我们可以构建限定理得到解释大量,二项分布Bn,p当n置信区间和进行假设检微观粒子的集体行为往较大时可用正态分布验,即使原始数据不服往表现出正态分布的特Nnp,np1-p近似;从正态分布性泊松分布Pλ当λ较大时可用正态分布Nλ,λ近似金融应用资产收益率的模型、期权定价理论、风险管理等金融领域广泛应用中心极限定理对于由多种因素影响的金融变量,中心极限定理提供了理论支持第六章数理统计的基本概念统计推断从样本到总体的科学推断统计量和抽样分布样本函数及其概率分布样本和抽样方法收集数据的科学方法总体和参数研究对象的整体和特征数理统计学是研究如何有效收集、分析和解释数据的科学,它是概率论理论在实际问题中的应用和延伸本章将介绍数理统计的基本概念,包括总体与样本、统计量及其抽样分布等内容,为后续的参数估计和假设检验奠定基础数理统计的核心问题是如何从带有随机性的样本数据中提取有用信息,并对总体特征做出合理推断掌握这些基本概念对于理解和应用统计方法至关重要总体和样本
6.1总体的概念样本的概念简单随机抽样总体是研究对象的全体,它是一个随机样本是从总体中抽取的部分个体,用于简单随机抽样是最基本的抽样方法,其变量及其分布总体可以是有限的,推断总体特征数学上,样本可以表示特点是每个个体被抽取的概率相X
①也可以是无限的为相互独立且与总体同分布的随机变量等;抽样是独立的
②序列X₁,X₂,...,Xₙ总体分布通常用分布函数或密度函简单随机抽样得到的样本Fx X₁,X₂,...,Xₙ数表示,其特征由参数描述,如均样本的实现值是通过观测是独立同分布的随机变量,其分布与总fxθx₁,x₂,...,xₙ值、方差等或试验获得的具体数据样本容量是体分布相同这种样本也称为代表性样μσ²n样本中包含的观测值个数本或简单样本在实际问题中,总体分布形式可能已知(如正态分布),但参数未知;也可能除简单随机抽样外,还有分层抽样、系分布形式和参数都未知统抽样、整群抽样等复杂抽样方法,适用于不同的研究目的和条件统计量
6.2统计量的定义统计量是样本的函数,不依赖于任何未知参数形式上,若T=gX₁,X₂,...,Xₙ,其中g是已知函数,则T是一个统计量统计量本身是随机变量,其分布称为抽样分布通过统计量的观测值,可以对总体参数进行估计或检验样本均值样本均值是最基本的统计量,定义为X̄=X₁+X₂+...+Xₙ/n若总体均值为μ,方差为σ²,则EX̄=μ,DX̄=σ²/n根据中心极限定理,当n较大时,无论总体分布如何,X̄-μ/σ/√n近似服从标准正态分布样本方差样本方差S²=[∑Xᵢ-X̄²]/n-1是总体方差σ²的无偏估计样本标准差S是样本方差的平方根,用于估计总体标准差σ对于正态总体,n-1S²/σ²服从自由度为n-1的卡方分布其他常用统计量样本k阶原点矩m̂ₖ=1/n∑Xᵢᵏ,用于估计总体k阶原点矩μₖ=EXᵏ样本k阶中心矩M̂ₖ=1/n∑Xᵢ-X̄ᵏ,用于估计总体k阶中心矩νₖ=E[X-μᵏ]样本中位数、样本极值、样本分位数等也是重要的统计量抽样分布
6.3分布χ²若Z₁,Z₂,...,Zₙ是相互独立的标准正态随机变量,则χ²=Z₁²+Z₂²+...+Zₙ²服从自由度为n的χ²分布χ²分布的期望为n,方差为2n当n较大时,χ²分布近似服从正态分布Nn,2n分布t若Z服从标准正态分布,V服从自由度为n的χ²分布,且Z与V独立,则t=Z/√V/n服从自由度为n的t分布t分布的密度函数关于原点对称,当n→∞时,t分布趋于标准正态分布分布F若U服从自由度为m的χ²分布,V服从自由度为n的χ²分布,且U与V独立,则F=U/m/V/n服从自由度为m,n的F分布若F服从Fm,n分布,则1/F服从Fn,m分布抽样分布是统计量作为随机变量的概率分布,它描述了统计量在重复抽样中可能取值的分布规律抽样分布是连接样本和总体的桥梁,是统计推断的基础χ²分布、t分布和F分布是统计学中最常用的三种抽样分布,它们广泛应用于区间估计和假设检验中这些分布的临界值通常通过查表或统计软件获得正态总体的抽样分布
6.4当总体服从正态分布时,样本统计量具有一些重要的精确分布结果
①样本均值X̄服从正态分布Nμ,σ²/n,其中μ和σ²分别是总体均值和方差
②样本方差n-1S²/σ²服从自由度为n-1的χ²分布
③X̄与S²相互独立这是正态总体的一个特殊性质
④X̄-μ/S/√n服从自由度为n-1的t分布此结果用于总体方差未知时的区间估计和假设检验
⑤两个独立的正态总体样本,其样本方差之比S₁²/S₂²乘以自由度修正因子服从F分布第七章参数估计点估计区间估计用单一数值估计总体参数构造包含参数的置信区间估计质量估计方法无偏性、有效性、一致性矩估计法、最大似然估计法等参数估计是统计推断的重要内容,它研究如何根据样本数据估计总体分布的未知参数本章将介绍点估计和区间估计的基本方法,包括矩估计法、最大似然估计法等,并讨论估计量的优良性准则在实际应用中,我们通常需要不仅给出参数的估计值,还要评估这个估计的精确程度,这就涉及到置信区间的构造掌握这些估计方法对于数据分析和科学研究至关重要点估计的概念
7.1定义点估计是用样本统计量的观测值作为总体参数的估计值若是待估参数,θ是基于样本的统计量,则的观测值称θ̂=gX₁,X₂,...,Xₙθ̂θ̂=gx₁,x₂,...,xₙ为的点估计θ无偏性若,则称是的无偏估计量无偏性意味着估计量的均值等于被估Eθ̂=θθ̂θ参数,反映了估计的平均准确性有效性在所有无偏估计量中,方差最小的估计量称为有效估计量有效性反映了估计的精确度,方差越小,估计越稳定一致性若,则称是的一致估计量一致性表明随着样lim[n→∞]P|θ̂-θ|ε=1θ̂θ本量增大,估计量将以概率收敛于真值1矩估计法
7.2计算样本矩计算样本的阶原点矩,,这些是总体阶原点矩k m̂ₖ=1/n∑Xᵢᵏk=1,2,...kμₖ=的估计EXᵏ建立矩方程根据总体分布,表示总体矩与参数之间的关系μₖθ₁,θ₂,...,θₘμₖ=,gₖθ₁,θ₂,...,θₘk=1,2,...,m求解方程组将样本矩代入矩方程,得到方程组,m̂ₖ=gₖθ̂₁,θ̂₂,...,θ̂ₘk=1,2,...,m求解这个方程组得到参数的矩估计值θ̂₁,θ̂₂,...,θ̂ₘ矩估计法是最古老的参数估计方法之一,其基本思想是用样本矩代替相应的总体矩,然后根据总体矩与参数之间的关系求解参数这种方法简单直观,不需要知道总体的具体分布形式,只需要知道参数与矩的关系矩估计量通常具有一致性,但不一定是无偏的或有效的在样本量较大时,矩估计法通常能给出合理的结果,但在小样本情况下,其效率可能不如最大似然估计法最大似然估计法
7.3构建似然函数对于给定的样本观测值x₁,x₂,...,xₙ,似然函数表示观测到这组数据的概率(密度)Lθ=fx₁,x₂,...,xₙ|θ对于独立同分布的样本,Lθ=∏fxᵢ|θ,其中f是概率(密度)函数取对数简化为简化计算,通常使用对数似然函数lθ=ln Lθ=∑ln fxᵢ|θ对数变换不改变最大值点的位置,但可以将乘积转换为和式,便于求导求导获得估计求解方程dlθ/dθ=0,得到使似然函数取最大值的参数估计θ̂对于多参数情况,需要求偏导数并解方程组还需要验证二阶导数为负,确保是极大值点最大似然估计法是一种广泛使用的参数估计方法,其基本思想是选择使观测数据出现概率最大的参数值作为估计值这种方法具有许多良好的统计性质,如渐近无偏性、渐近有效性和渐近正态性在大样本情况下,最大似然估计通常是最优的估计方法然而,在某些复杂模型中,似然函数可能难以显式表示,或者最大化问题没有解析解,需要使用数值方法求解区间估计的概念
7.41-α[L,U]置信水平置信区间区间包含真参数的概率包含参数的随机区间α显著性水平区间不包含参数的概率区间估计是用一个区间来估计总体参数的方法,它不仅给出参数的估计值,还提供了估计精度的量化度量置信区间是区间估计的结果,它是一个随机区间[L,U],满足PL≤θ≤U=1-α,其中1-α称为置信水平,α称为显著性水平置信区间的正确解释是若重复进行抽样和区间构造过程,则约有1001-α%的区间会包含真实参数θ置信水平反映了估计的可靠性,常用的置信水平有
0.
95、
0.99等区间的宽度反映了估计的精确度,样本量越大,区间通常越窄正态总体均值的区间估计
7.5总体方差已知总体方差未知当总体~且已知时,的置信水平为的置信区当总体~但未知时,的置信水平为的置信区X Nμ,σ²σ²μ1-αX Nμ,σ²σ²μ1-α间为间为X̄±z[α/2]·σ/√n X̄±t[α/2]n-1·S/√n其中是标准正态分布的上分位点,是样本均值其中是自由度为的分布的上分位点,是z[α/2]α/2X̄t[α/2]n-1n-1tα/2S样本标准差这个区间基于~,区间长度为,随X̄Nμ,σ²/n2z[α/2]·σ/√n样本量的增加而减小这个区间基于~,区间长度通常大于已n X̄-μ/S/√n tn-1σ²知时的区间,反映了额外的不确定性在实际应用中,总体方差通常是未知的,因此基于分布的置信区间更为常用当样本量很大时,分布趋近于标准正态分布,两t nt种方法的结果几乎相同正态总体方差的区间估计
7.6单个正态总体两个正态总体对于总体~,的置信水平为的置信区间为对于两个独立的正态总体~和~,方X Nμ,σ²σ²1-αX₁Nμ₁,σ₁²X₂Nμ₂,σ₂²差比的置信水平为的置信区间为σ₁²/σ₂²1-α[n-1S²/χ²[α/2]n-1,n-1S²/χ²[1-α/2]n-1][S₁²/S₂²·1/F[α/2]n₁-1,n₂-1,S₁²/S₂²·1/F[1-α/2]n₁-1,n₂-其中和分别是自由度为的分χ²[α/2]n-1χ²[1-α/2]n-1n-1χ²1]布的上和上分位点,是样本方差α/21-α/2S²其中和是自由度为F[α/2]n₁-1,n₂-1F[1-α/2]n₁-1,n₂-1n₁-这个区间基于~,通常是不对称的n-1S²/σ²χ²n-1的分布的分位点,和是两个样本的方差1,n₂-1F S₁²S₂²这个区间基于~,用于比F=S₁²/σ₁²/S₂²/σ₂²Fn₁-1,n₂-1较两个总体的方差是否相等第八章假设检验提出假设确定原假设H₀和备择假设H₁选择检验统计量根据假设和数据选择适当的统计量确定拒绝域基于显著性水平α设定临界值计算统计量值根据样本数据计算检验统计量做出决策比较统计量值与临界值,决定是否拒绝原假设假设检验是统计推断的重要方法,用于判断关于总体参数的某个假设是否合理它通过样本信息来判断是接受(更准确地说是不拒绝)还是拒绝原假设假设检验与区间估计是密切相关的两种推断方法,在实际应用中相互补充假设检验的基本思想是反证法首先假设原假设为真,然后根据样本证据判断这个假设是否合理如果样本结果与原假设下的预期存在显著差异,则拒绝原假设;否则不拒绝原假设假设检验的基本概念
8.1决策真实情况为真为真\H₀H₁接受正确决策第二类错误H₀1-αβ拒绝第一类错误正确决策H₀α1-β假设检验的基本要素包括原假设、备择假设、检验统计量、拒绝域、显著性水平和值H₀H₁αp原假设通常是我们想要检验的假设,通常表述为参数等于某个特定值备择假设是与原假设互斥的另一种可能性,可以是H₀H₁单侧的(参数大于或小于某值)或双侧的(参数不等于某值)在假设检验中可能出现两类错误第一类错误是指为真但被拒绝的概率,由控制;第二类错误是指为假但未被拒绝的概率H₀αH₀,记为检验的功效定义为,即当为真时正确拒绝的概率β1-βH₁H₀值是在原假设成立的条件下,得到当前或更极端的样本结果的概率值越小,越有理由拒绝原假设通常,当时,拒绝原p ppα假设正态总体均值的检验
8.2单个总体两个总体假设总体~,要检验对(或假设两个独立的总体~和~,要检验X Nμ,σ²H₀:μ=μ₀H₁:μ≠μ₀μX₁Nμ₁,σ₁²X₂Nμ₂,σ₂²或)对(或或)μ₀μμ₀H₀:μ₁=μ₂H₁:μ₁≠μ₂μ₁μ₂μ₁μ₂当已知时,检验统计量为~当和已知时,检验统计量为σ²Z=X̄-μ₀/σ/√n N0,1σ₁²σ₂²Z=X̄₁-X̄₂-μ₁-~μ₂/√σ₁²/n₁+σ₂²/n₂N0,1当未知时,检验统计量为~当但未知时,检验统计量为σ²t=X̄-μ₀/S/√n tn-1σ₁²=σ₂²=σ²t=X̄₁-X̄₂-μ₁~,其中是合并方-μ₂/Sp·√1/n₁+1/n₂tn₁+n₂-2Sp²双侧检验的拒绝域为或单侧检|Z|z[α/2]|t|t[α/2]n-1差验相应调整当且未知时,使用近似检验,自由度需要调整σ₁²≠σ₂²t正态总体方差的检验
8.3单个总体假设总体X~Nμ,σ²,要检验H₀:σ²=σ₀²对H₁:σ²≠σ₀²(或σ²σ₀²或σ²σ₀²)检验统计量为χ²=n-1S²/σ₀²~χ²n-1双侧检验的拒绝域为χ²χ²[1-α/2]n-1或χ²χ²[α/2]n-1单侧检验相应调整两个总体假设两个独立的总体X₁~Nμ₁,σ₁²和X₂~Nμ₂,σ₂²,要检验H₀:σ₁²=σ₂²对H₁:σ₁²≠σ₂²(或σ₁²σ₂²或σ₁²σ₂²)检验统计量为F=S₁²/S₂²~Fn₁-1,n₂-1,其中H₀下F~Fn₁-1,n₂-1双侧检验的拒绝域为FF[1-α/2]n₁-1,n₂-1或FF[α/2]n₁-1,n₂-1单侧检验相应调整应用场景方差的检验在实际应用中具有重要意义,例如
①评估测量系统的精确度;
②比较不同生产工艺的稳定性;
③判断数据是否满足某些统计方法的同方差假设分布拟合检验
8.4分布拟合检验用于检验样本是否来自某个特定的理论分布常用的方法有
①皮尔逊χ²拟合优度检验将数据分成k个区间,比较观测频数Oᵢ与理论频数Eᵢ的差异检验统计量为χ²=∑Oᵢ-Eᵢ²/Eᵢ,在H₀成立时近似服从χ²k-1-r分布,其中r是估计的参数个数
②柯尔莫哥洛夫检验比较经验分布函数Fₙx与理论分布函数Fx的最大偏差检验统计量为D=max|Fₙx-Fx|,其分布与样本量有关,通常查表获得临界值这些检验方法各有优缺点χ²检验适用范围广但对区间划分敏感;柯尔莫哥洛夫检验对连续分布更有效,且不依赖于区间划分,但当参数需要从样本估计时,其分布会变复杂独立性检验
8.5显著高于期望略高于期望接近期望略低于期望显著低于期望复习要点总结重点公式回顾1全概率公式、贝叶斯公式、期望和方差性质、常见分布的特征、大数定律和中心极限定理、统计量的分布、区间估计公式、假设检验统计量典型题型分析2古典概型计算、条件概率问题、随机变量函数分布、参数估计、假设检验、分布拟合检验、独立性检验常见错误提示3概率加法原理误用、条件概率混淆、独立性判断错误、假设检验结论表述不准确、p值解释错误、参数估计方法选择不当解题策略指导明确问题类型、选择适当方法、规范解题步骤、注意结论表述、检查计算结果合理性、关注题目条件和假设结束语学习建议答疑时间安排概率论学习需要理论与实践相结合建期末考试前两周,每周三下午14:00-议大家在复习理论的同时,多做习题巩16:00在数学楼204教室安排集中答疑固知识,并尝试将概率统计方法应用到此外,可通过电子邮件预约个别答疑实际问题中理解概念比记忆公式更重时间所有复习材料和习题解答将上传要,只有真正理解了基本原理,才能灵至课程网站,请大家及时查看和下载活应对各种问题参考资源推荐除了课本和讲义外,推荐《概率论与数理统计习题全解指南》作为辅助材料图书馆电子资源中的统计学习视频也很有帮助对于对概率论有浓厚兴趣的同学,可以阅读《概率论基础教程》深入学习本学期的概率论课程即将结束,希望通过这门课程的学习,大家不仅掌握了概率统计的基本知识和方法,更重要的是培养了数学思维和分析问题的能力概率统计思想在现代科学技术和社会生活中有着广泛的应用,它将成为你们专业学习和未来工作的重要工具祝愿大家在期末考试中取得好成绩,更希望大家能够将所学知识真正内化为自己的能力,在未来的学习和工作中灵活运用如有任何问题,随时欢迎与我交流讨论。
个人认证
优秀文档
获得点赞 0