还剩46页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
概率论与数理统计复习本课程全面覆盖概率论与数理统计的核心概念与重点难点,适用于期末考试和综合复习我们将通过系统的理论讲解、详细的例题分析和实际应用实例,帮助同学们深入理解概率统计的基本原理和计算方法课程目录12概率论基础随机变量及其分布随机事件与概率、条件概率、独立性离散型与连续型随机变量、常见分布3多维随机变量数字特征与统计方法联合分布、边缘分布、条件分布第一章随机事件与概率随机试验的特点样本空间与随机事件可重复性、可观察性、不确定性是随机试验的三个基本特征样本空间Ω包含所有可能结果,随机事件是样本空间的子集事件的关系与运算概率的定义与性质包含、相等、并、交、互不相容、对立等关系构成事件运算基公理化定义建立了概率的数学框架和基本运算规则础随机试验可重复性可观察性不确定性试验可以在相同条件下试验结果可以被观察和单次试验的结果无法预重复进行,这是统计分记录,形成数据集合先确定,但大量重复时析的基础每次重复都观察结果必须明确且可呈现统计规律性这种保持相同的实验条件和以量化或分类不确定性是概率论研究程序的核心样本空间与随机事件样本空间Ω所有可能结果的集合,是概率论研究的基础框架样本空间的确定是进行概率分析的第一步随机事件样本空间的子集,表示我们关心的某种试验结果事件可以是简单事件或复合事件基本事件单个样本点构成的事件,不能再分解基本事件是构成其他复杂事件的基本单元特殊事件必然事件Ω和不可能事件∅代表概率的两个极端情况,分别对应概率1和0事件的关系与运算基本关系运算操作包含关系A⊂B表示事件A发生必然导致事件B发生相等关系和事件A∪B表示A或B至少有一个发生积事件A∩B表示A和BA=B表示两个事件在本质上相同,包含相同的样本点同时发生对立事件表示A的补集•包含关系A⊂B•和事件A∪B•相等关系A=B•积事件A∩B•互不相容A∩B=∅•对立事件A̅=Ω-A概率的定义与性质公理化定义科尔莫哥洛夫概率公理系统基本性质PΩ=1,P∅=0,0≤PA≤1可列可加性互不相容事件序列的概率等于各事件概率之和概率的公理化定义为概率论奠定了严格的数学基础这三个公理简洁而完备,从中可以推导出概率的所有重要性质和运算法则概率的运算法则与基本公式互补公式减法公式PA̅=1-PA对立事件的概率之和等于加法公式PA-B=PA-PA∩B计算事件A发生但1,这是概率计算中最常用的公式之一PA∪B=PA+PB-PA∩B这个公式处事件B不发生的概率,即A与B的差集的概理两个事件至少有一个发生的概率,需要率减去重复计算的部分条件概率定义公式基本性质PB|A=PAB/PA,其中PA0条件概率满足概率的所有性质多事件乘法乘法公式多个事件同时发生的概率计算PAB=PAPB|A=PBPA|B全概率公式与贝叶斯公式全概率公式贝叶斯公式当样本空间被完备事件组{B₁,B₂,...,Bₙ}分割时,任意事件A的贝叶斯公式PBᵢ|A=PBᵢPA|Bᵢ/∑PBⱼPA|Bⱼ,用于计概率可以表示为PA=∑PBᵢPA|Bᵢ算后验概率这个公式将复杂概率问题分解为多个简单的条件概率问题,是概事前概率PBᵢ在观察到事件A后更新为事后概率PBᵢ|A,体现率计算的重要工具了贝叶斯推理的核心思想事件的独立性基本定义条件概率性质若PAB=PAPB,则A与B相互独立,表示一个事件的发生不影响另一个事件的概率若A与B独立,则PA|B=PA,即B的发生不改变A发生的概率多事件独立两两独立不等于相互独立相互独立要求任意子集的事件都满足独立性条件概率计算的常用模型古典概型几何概型等可能概率模型,所有基本事件发生的概率相等概率计随机点落入区域的概率模型,概率与几何度量(长度、面算公式为有利结果数除以总结果数积、体积)成正比超几何分布伯努利模型不放回抽样模型,从有限总体中无放回地抽取样本时的概独立重复试验模型,每次试验只有两种可能结果,且各次率分布试验相互独立第二章随机变量及其分布随机变量定义从样本空间到实数集的函数映射离散型随机变量取值可列的随机变量及其分布律连续型随机变量具有概率密度函数的随机变量分布函数性质描述随机变量概率特征的重要工具随机变量的定义函数映射变量分类随机变量是从样本空间Ω到实数集R的函离散型、连续型和混合型三种基本类型数Xω概率分析数量化工具通过随机变量研究概率规律和统计特征将随机现象转化为数学问题进行分析离散型随机变量有限1取值特征分布律性质取值有限或可列无限个所有概率之和等于1种3常见分布0-1分布、二项分布、泊松分布离散型随机变量的分布律P{X=xᵢ}=pᵢ完全描述了变量的概率特征分布律必须满足非负性和归一性两个基本条件,即pᵢ≥0且∑pᵢ=1分布与二项分布0-1分布二项分布0-1最简单的离散分布,只有两个可能取值0和1概率公式为n次独立伯努利试验中成功次数的分布概率公式为P{X=k}=p^k1-p^1-k,其中k=0,1常用于建模二元选择问P{X=k}=C_n^k p^k1-p^n-k,记作X~Bn,p广泛应用于质题量控制和抽样调查泊松分布定义与公式泊松定理与应用泊松分布的概率质量函数为P{X=k}=λ^k e^-λ/k!,其中当n很大,p很小,而np=λ适中时,二项分布Bn,p近似服从泊k=0,1,2,...,λ0是分布参数松分布Pλ记作X~Pλ,λ既是分布的均值也是方差,体现了泊松分布的一泊松分布广泛应用于描述稀有事件,如电话呼叫次数、交通事故个重要特征数量、放射性衰变等随机现象分布函数基本定义Fx=P{X≤x}表示随机变量X不超过x的概率,是描述随机变量概率特征的重要工具重要性质F-∞=0,F+∞=1,Fx单调不减且右连续这些性质确保了分布函数的数学合理性概率计算P{a连续型随机变量积分关系Fx=∫_{-∞}^x ftdt导数关系fx=Fx密度函数性质fx≥0,∫_{-∞}^{+∞}fxdx=1连续型随机变量通过概率密度函数fx来描述其概率特征密度函数在某点的值不代表概率,而是概率密度,真正的概率通过在区间上的积分来计算均匀分布分布记号X~U[a,b]概率密度fx=1/b-a,a≤x≤b分布函数Fx=0x应用场景随机数生成、几何概型均匀分布是最简单的连续分布,在区间[a,b]上具有常数密度它在计算机随机数生成和几何概率问题中有重要应用,常作为其他分布的基础指数分布分布定义X~Eλ,概率密度fx=λe^-λx,x0分布函数Fx=1-e^-λx,x≥0参数λ0称为强度参数无记忆性P{Xs+t|Xs}=P{Xt},这是指数分布的独特性质已经等待s时间不影响未来等待时间的分布实际应用寿命分析、排队理论、可靠性工程中广泛应用常用于建模等待时间、服务时间等随机现象正态分布分布定义标准正态分布X~Nμ,σ²,概率密度函数为fx=1/√2πσe^-x-当μ=0,σ²=1时,称为标准正态分布Z~N0,1任意正态分布都μ²/2σ²,其中μ是位置参数,σ²是尺度参数可以通过标准化变换转化为标准正态分布正态分布是最重要的连续分布,具有完美的对称性和钟形特征,标准化公式Z=X-μ/σ,这使得我们只需要一个标准正态分布在自然界和社会现象中广泛存在表就能计算所有正态分布的概率标准正态分布表的使用分布函数定义Φz=P{Z≤z}=∫_{-∞}^z1/√2πe^-t²/2dt,表示标准正态分布的累积概率重要性质Φ0=
0.5反映了标准正态分布的对称性Φ-z=1-Φz利用对称性简化计算概率计算P{a第三章多维随机变量联合分布二维随机变量Fx,y=P{X≤x,Y≤y}描述联合概率特征向量X,Y描述两个随机现象的联合行为边缘分布从联合分布推导单个变量的分布独立性条件分布两个随机变量相互不影响的数学表征已知一个变量取值条件下另一变量的分布二维随机变量的定义向量表示二维随机变量X,Y是定义在同一样本空间上的两个随机变量的有序对,描述了两个随机现象的联合行为联合分布函数Fx,y=P{X≤x,Y≤y}给出了两个变量同时不超过给定值的概率,完全刻画了二维随机变量的概率特征3离散型情形联合分布律P{X=xᵢ,Y=yⱼ}=pᵢⱼ,满足pᵢⱼ≥0且∑∑pᵢⱼ=1,通过二维表格表示4连续型情形存在联合概率密度函数fx,y,使得Fx,y=∫∫fu,vdudv,密度函数满足非负性和归一性边缘分布离散型边缘分布连续型边缘密度对于离散型二维随机变量,X的边缘分布律为P{X=xᵢ}=∑ⱼP{X=x对于连续型二维随机变量,X的边缘密度函数为fₓx=∫_{-ᵢ,Y=yⱼ},即对所有可能的Y值求和∞}^{+∞}fx,ydy,对y进行积分同样,Y的边缘分布律为P{Y=yⱼ}=∑ᵢP{X=xᵢ,Y=yⱼ}边缘分布Y的边缘密度函数为fᵧy=∫_{-∞}^{+∞}fx,ydx边缘密度函数律反映了单个变量的概率特征,不考虑另一变量的影响完全确定了各个分量的分布特征条件分布离散型条件分布P{X=xᵢ|Y=yⱼ}=P{X=xᵢ,Y=yⱼ}/P{Y=yⱼ}=pᵢⱼ/p·ⱼ连续型条件密度f_{X|Y}x|y=fx,y/f_Yy,当f_Yy0时条件概率计算利用条件分布可以计算已知一个变量取值时另一变量的概率随机变量的独立性独立性定义若Fx,y=FₓxFᵧy对所有x,y成立,则称X与Y相互独立这意味着一个变量的取值不影响另一个变量的分布2离散型判定离散型随机变量独立的充要条件是P{X=xᵢ,Y=yⱼ}=P{X=xᵢ}P{Y=yⱼ}对所有i,j成立3连续型判定连续型随机变量独立的充要条件是fx,y=fₓxfᵧy在几乎所有点成立第四章随机变量的数字特征数学期望方差与标准差协方差与相关系数反映随机变量取值的平均水平,是最度量随机变量取值的分散程度,方差描述两个随机变量之间的线性关系强重要的位置特征期望值给出了随机越大说明取值越分散,越小说明取值度,是研究变量间相关性的重要工变量的重心位置越集中具数学期望重要性质1EC=C,EaX+b=aEX+b,EX+Y=EX+EY连续型计算2EX=∫_{-∞}^{+∞}xfxdx离散型计算3EX=∑ᵢxᵢpᵢ数学期望是随机变量最重要的数字特征,它给出了随机变量取值的平均水平期望的线性性质使得复杂随机变量的期望计算变得简单,这在实际应用中具有重要意义方差与标准差方差定义VarX=E[X-EX²],衡量随机变量偏离其期望的平均程度计算公式2VarX=EX²-[EX]²,这是方差计算的简化公式标准差3σX=√VarX,与原变量同量纲,便于实际解释方差性质4VarC=0,VaraX+b=a²VarX,独立时VarX+Y=VarX+VarY协方差与相关系数协方差相关系数协方差定义为CovX,Y=E[X-EXY-EY],反映两个随机变量相关系数ρₓᵧ=CovX,Y/√VarXVarY,是标准化的协方差,的线性相关程度消除了量纲影响计算公式CovX,Y=EXY-EXEY协方差为正表示正相相关系数的取值范围是[-1,1]|ρₓᵧ|=1表示完全线性相关,ρₓᵧ关,为负表示负相关,为零表示不相关=0表示线性无关常见分布的数字特征分布类型期望EX方差VarX二项分布Bn,p npnp1-p泊松分布Pλλλ均匀分布U[a,b]a+b/2b-a²/12指数分布Eλ1/λ1/λ²正态分布Nμ,σ²μσ²掌握常见分布的数字特征有助于快速计算和理解随机变量的性质特别注意泊松分布的期望和方差相等,正态分布的参数直接对应期望和方差第五章大数定律与中心极限定理切比雪夫不等式大数定律1提供概率的上界估计,不依赖于具体分样本均值依概率收敛到总体均值布实际应用4中心极限定理统计推断和近似计算的理论基础样本均值的标准化趋向标准正态分布切比雪夫不等式不等式表述对任意ε0,有P{|X-EX|≥ε}≤VarX/ε²这给出了随机变量偏离其期望的概率上界等价形式P{|X-EX|ε}≥1-VarX/ε²,表明随机变量在期望附近的概率下界重要意义即使不知道随机变量的具体分布,仅凭期望和方差就能估计其取值范围的概率大数定律弱大数定律辛钦大数定律对于独立同分布的随机变量序列,样本均值X̄依概率收敛到总体均值μ,即X̄→μ强大数定律柯尔莫哥洛夫Plim_{n→∞}X̄ₙ=μ=1,表示样本均值以概率1收敛到总体均值,这是更强的收敛性伯努利大数定律在n次独立试验中,事件A出现的频率nₐ/n依概率收敛到事件A的概率p实际应用为频率稳定性和统计估计提供理论基础,解释了为什么大样本更可靠中心极限定理定理表述设{Xᵢ}为独立同分布的随机变量序列,EXᵢ=μ,VarXᵢ=σ²,则∑Xᵢ-nμ/σ√n依分布收敛到N0,1独立同分布条件林德伯格-列维定理要求随机变量独立同分布且方差有限这是中心极限定理最经典的形式分布收敛不管原始分布是什么,标准化的样本和总是趋向于标准正态分布,这是概率论的一个奇迹中心极限定理的应用连续性校正二项分布正态近似用连续分布近似离散分布时,需要进行
0.5抽样分布近似当n较大时,Bn,p近似服从Nnp,np1-的连续性校正,即P{X=k}≈P{k-
0.5当样本容量足够大时,样本均值的分布近p标准化后Bn,p-np/√np1-p近似为正态分布,这为统计推断提供了重要似N0,1工具第六章数理统计基础总体与样本总体是研究对象的全体,样本是从总体中抽取的部分个体,是统计推断的基础统计量定义完全由样本确定且不含未知参数的随机变量,是进行统计分析的工具3样本数字特征样本均值、样本方差等统计量用于估计总体参数和描述样本特征常用统计分布χ²分布、t分布、F分布是统计推断中的重要工具分布总体与样本基本概念抽样方法总体是研究对象所有可能观测值的集合,代表我们要了解的完整简单随机抽样是最基本的抽样方法,要求每个个体被抽中的概率信息样本是从总体中按一定方式抽取的部分观测值相等且各次抽取相互独立总体容量可能是有限的或无限的,而样本容量总是有限的通过样本容量的选择需要平衡精度要求和成本考虑一般来说,样本样本来推断总体特征是统计学的核心任务容量越大,统计推断的精度越高统计量定义特征统计量是完全由样本决定的随机变量,不能包含任何未知参数它是连接样本和总体的桥梁常用统计量样本均值X̄、样本方差S²、样本标准差S是最常用的统计量,分别估计总体的位置和散布特征充分统计量包含样本关于未知参数全部信息的统计量利用充分统计量可以构造最优的估计量抽样分布统计量作为随机变量也有自己的概率分布,称为抽样分布,这是进行统计推断的基础常用统计分布分布分布分布χ²t F若Z₁,Z₂,...,Zₙ独立同服从N0,1,则∑Zᵢ若Z~N0,1,Y~χ²n且相互独立,则若X~χ²m,Y~χ²n且相互独立,则²~χ²nχ²分布主要用于方差的估计和检T=Z/√Y/n~tnt分布用于小样本均值F=X/m÷Y/n~Fm,nF分布主要用于两验,分布形状随自由度变化的推断,随自由度增大趋向标准正态分个方差的比较和方差分析布第七章参数估计估计量评价无偏性、有效性、一致性区间估计置信区间的构造方法点估计方法矩估计法、最大似然估计法参数估计是利用样本信息对总体参数进行估计的方法点估计给出参数的具体数值,区间估计给出参数的可能范围及其可信程度点估计方法矩估计法用样本矩估计总体矩,方法简单直观设总体k阶矩存在,用样本k阶矩估计总体k阶矩最大似然估计选择使似然函数达到最大值的参数值作为估计值具有良好的大样本性质估计量评价标准无偏性要求Eθ̂=θ,有效性比较方差大小,一致性要求依概率收敛到真值区间估计置信区间定义置信水平1由样本确定的随机区间,以一定概率包含未置信区间包含真实参数值的概率,通常取知参数
0.95或
0.99样本容量影响单侧与双侧大样本和小样本的处理方法不同根据问题需要选择单侧或双侧置信区间常见参数的区间估计正态总体均值估计其他参数估计当σ²已知时,μ的置信区间为X̄±z_{α/2}σ/√n,利用正态分布的正态总体方差σ²的置信区间基于χ²分布构造n-性质1S²/χ²_{α/2}n-1≤σ²≤n-1S²/χ²_{1-α/2}n-1当σ²未知时,μ的置信区间为X̄±t_{α/2}n-1S/√n,需要使用t分二项分布参数p的大样本置信区间为p̂±z_{α/2}√p̂1-p̂/n,其布而不是正态分布中p̂是样本比例第八章假设检验基本思想1通过样本信息判断总体参数的假设是否成立显著性检验2控制第一类错误概率的检验方法正态总体检验均值、方差的单样本和双样本检验非参数检验4不依赖于总体分布的检验方法假设检验的基本步骤₀H提出假设原假设H₀与备择假设H₁α确定显著性水平第一类错误的容许概率T构造检验统计量选择合适的统计量和拒绝域P计算与决策计算统计量值并做出统计决策假设检验中存在两类错误第一类错误是拒绝真的原假设,第二类错误是接受假的原假设显著性检验法控制第一类错误的概率不超过显著性水平α。
个人认证
优秀文档
获得点赞 0