还剩44页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
概率论与数理统计概率论与数理统计是现代科学技术的重要数学基础,在工程、经济、医学、计算机科学等领域发挥着关键作用本课程将系统介绍概率论的基本概念、随机变量理论、数理统计方法及其实际应用课程概述教材基础章节安排基于浙江大学《概率论与数理包含8个主要章节,从基础概统计》第三版教材,内容权威率概念到高级统计推断,循序系统,理论严谨完整渐进构建知识体系应用导向教学目标掌握基本概念培养分析能力解决实际问题全面理解概率论与数理发展学生的随机分析能学会运用概率统计方法统计的基本概念、原理力和统计思维,提高数分析处理各种实际问和方法,建立扎实的理据分析和推理判断水平题,增强应用实践能力论基础奠定学习基础为学生后续专业课程学习和科学研究工作提供必要的数学工具和方法支撑课程内容概览概率理论基础极限理论•第一章随机事件与概率•第五章大数定律和中心极限定理•第二章随机变量及其分布•第三章多维随机变量及其分布•第四章随机变量的数字特征数理统计方法•第六章数理统计的基本概念•第七章参数估计•第八章假设检验第一章随机事件与概率核心内容主要知识点本章是概率论的基础,介绍随机现象的数学模型从随机试验开•随机试验与样本空间始,建立样本空间概念,定义事件及其运算,引入概率的定义和•事件的关系与运算基本性质•概率的定义与性质重点掌握条件概率、全概率公式、贝叶斯公式以及事件独立性的•条件概率与贝叶斯公式概念和应用,这些都是后续学习的重要基础•事件的独立性随机试验
1.1随机试验特征可重复性、多种可能结果、结果的不确定性样本空间所有可能结果的集合,用Ω表示样本点试验的每一个可能结果,样本空间的元素事件概念样本空间的子集,包括基本事件和复合事件事件的关系与运算
1.2包含关系互斥与对立事件A发生必然导致事件B发生,记作A⊂B,称A为B的子事件互斥事件不能同时发生,对立事件恰好有一个发生,满足运算律123并事件与交事件并事件A∪B表示A或B至少一个发生,交事件A∩B表示A和B同时发生概率的定义
1.3公理化定义现代概率论的严格数学基础1统计定义2频率的极限,反映随机性本质古典概型3等可能性假设下的概率计算概率的三种定义从不同角度刻画了随机事件发生可能性的大小古典概型适用于有限等可能的情况,统计定义体现了概率的客观性,公理化定义为概率论提供了严格的数学基础概率具有非负性、规范性和可列可加性等基本性质条件概率
1.4条件概率定义1在已知事件B发生条件下事件A发生的概率乘法公式2联合概率等于边缘概率乘以条件概率全概率公式3利用完备事件组计算复杂事件概率贝叶斯公式4根据结果推断原因,在决策分析中广泛应用事件的独立性
1.5独立性定义独立性判断事件A的发生不影响事件B发生的概率,1PAB=PAPB是两事件独立的充分必要即PB|A=PB2条件伯努利试验独立重复试验4只有两种可能结果的独立重复试验,是各次试验相互独立且条件相同的试验序3重要的概率模型列第二章随机变量及其分布随机变量概念将随机试验的结果用数值表示,建立从样本空间到实数的映射关系,为定量分析随机现象提供数学工具分布类型根据随机变量取值特点分为离散型和连续型,每种类型有不同的概率描述方法和重要分布族分布函数统一描述随机变量概率性质的重要工具,具有单调性、右连续性等重要性质随机变量的概念
2.112随机变量定义分类标准样本空间到实数集的可测映射按取值特点分为离散型和连续型3分布函数Fx=PX≤x完全确定随机变量性质随机变量是概率论中的核心概念,它将随机现象的结果用数值来表示,使我们能够运用数学分析方法研究随机现象分布函数是描述随机变量概率特性的最基本和最重要的函数,它包含了随机变量的全部概率信息离散型随机变量
2.2连续型随机变量
2.3连续型随机变量用概率密度函数描述分布特征均匀分布在指定区间内各点概率密度相等,指数分布常用于描述寿命和等待时间,正态分布是最重要的连续分布,具有良好的数学性质和广泛的实际应用背景随机变量函数的分布
2.4离散型情况连续型情况当Y=gX且X为离散型随机变量时,需要找出Y的所有可能取值,可以使用分布函数法或者概率密度变换公式分布函数法适用于然后计算每个取值对应的概率关键是确定使得gX=y的所有X任何单调函数,而雅可比行列式方法适用于可微的严格单调函值数对于一对一函数,分布变换相对简单;对于多对一函数,需要将对于复杂的函数关系,还可以使用卷积公式来求两个独立随机变所有对应的X值的概率相加量和的分布第三章多维随机变量及其分布条件分布边缘分布给定部分变量条件下其他变量的分布单个随机变量的分布特征•边缘分布函数•条件概率密度联合分布•边缘密度函数•条件期望独立性•与联合分布的关系•贝叶斯更新描述多个随机变量共同的概率特性随机变量间相互不影响的性质•联合分布函数•独立性定义•联合概率密度•独立性判断•联合概率质量函数•独立变量的性质2314二维随机变量
3.11基本概念2联合分布函数二维随机变量X,Y是定义在同Fx,y=PX≤x,Y≤y完全确定二一样本空间上的两个随机变维随机变量的概率性质,具有量,它们共同描述随机试验的单调性和连续性两个数值结果3离散型与连续型根据随机变量类型分别用联合概率质量函数或联合概率密度函数来描述分布特征边缘分布
3.2边缘分布函数FXx=Fx,+∞,FYy=F+∞,y离散型边缘分布pXx=Σy pXYx,y连续型边缘分布fXx=∫fXYx,ydy分布关系边缘分布可由联合分布确定,反之不成立条件分布
3.3分布类型条件分布定义性质离散型PX=x|Y=y=PX=x,Y=y/PY=y概率和为1连续型fX|Yx|y=fXYx,y/fYy积分为1混合型根据具体情况定义满足概率公理条件分布描述在已知部分信息条件下其他随机变量的概率行为它在贝叶斯统计、机器学习和决策理论中有重要应用,能够实现信息更新和不确定性传播随机变量的独立性
3.4独立性定义独立性判断独立变量函数Fx,y=FXxFYy或检验联合分布是否等于若X与Y独立,则gX与fx,y=fXxfYy是随机边缘分布的乘积,或者hY也独立,这为复杂变量独立的充要条件检验条件分布是否等于问题的分析提供便利边缘分布多变量独立n个随机变量相互独立需要任意子集的联合分布等于各边缘分布的乘积二维随机变量函数的分布
3.5和的分布Z=X+Y的分布可以通过卷积公式求得fZz=∫fXYx,z-xdx当X,Y独立时,公式简化为fZz=∫fXxfYz-xdx差的分布W=X-Y的分布fWw=∫fXYx,x-wdx独立情况下为fWw=∫fXxfYx-wdx积与商的分布U=XY和V=X/Y的分布需要使用变量变换技术,通过雅可比行列式计算得到最值分布maxX,Y和minX,Y的分布在可靠性理论和极值统计中有重要应用第四章随机变量的数字特征1期望随机变量的平均水平,反映分布的位置特征,是最重要的数字特征之一2方差衡量随机变量取值的分散程度,反映分布的离散性特征3协方差与相关系数描述两个随机变量间线性关系强度的数字特征4矩与特征函数更高阶的数字特征和分布的唯一性刻画工具期望
4.1函数期望1E[gX]=∫gxfxdx期望性质2线性性E[aX+bY]=aE[X]+bE[Y]基本定义3离散型E[X]=Σxpx,连续型E[X]=∫xfxdx期望是随机变量最重要的数字特征,它给出了随机变量取值的重心或平均水平期望具有线性性质,这使得复杂随机变量期望的计算变得相对简单对于独立随机变量的乘积,期望等于期望的乘积方差
4.2协方差与相关系数
4.3协方差定义1CovX,Y=E[X-E[X]Y-E[Y]]衡量两变量的线性关系相关系数2ρ=CovX,Y/σXσY是标准化的协方差,取值范围[-1,1]线性相关性3|ρ|=1表示完全线性相关,ρ=0表示不存在线性关系协方差矩阵4多维随机变量的协方差构成正定对称矩阵,刻画变量间关系矩与中心矩
4.4阶原点矩k阶中心矩kmk=E[Xk]描述分布的形状特征,一阶矩1μk=E[X-E[X]k],二阶中心矩即为方差就是期望值2峰度系数偏度系数4γ2=μ4/σ⁴-3衡量分布的尖峭程度,正值γ1=μ3/σ³衡量分布的对称性,正偏表示3表示比正态分布更尖右尾较长特征函数
4.5定义与性质重要应用特征函数φt=E[e^itX]是概率分布的傅里叶变换,具有唯一性定利用特征函数可以方便地求随机变量和的分布,独立随机变量和理它总是存在的,且|φt|≤1,φ0=1的特征函数等于各自特征函数的乘积特征函数完全确定分布,不同分布有不同的特征函数,这为研究通过特征函数的导数可以求得各阶矩,为计算期望、方差等数字分布提供了强有力的工具特征提供了统一的方法第五章大数定律和中心极限定理大数定律揭示大量随机现象平均结果的稳定性,为统计推断的理论基础当试验次数增大时,样本均值收敛到总体均值中心极限定理说明独立随机变量和的分布趋于正态分布,解释了正态分布在概率论中的中心地位和广泛应用实际应用这两个定理为统计学的抽样理论、估计理论和假设检验提供了重要的理论依据,在实际问题中有广泛应用大数定律
5.1弱大数定律样本均值依概率收敛到总体均值•切比雪夫大数定律•辛钦大数定律•马尔科夫大数定律强大数定律样本均值几乎必然收敛到总体均值•柯尔莫哥洛夫强大数定律•收敛性更强•理论意义重大伯努利大数定律频率收敛到概率的经典结果•最早的大数定律•频率解释概率的依据•统计学基础中心极限定理
5.2实际应用
5.3抽样调查应用利用中心极限定理,小样本均值近似服从正态分布,为构造置信区间和进行假设检验提供理论基础大数定律保证样本均值是总体均值的一致估计质量控制应用在生产过程中,利用控制图监控产品质量当样本均值超出控制限时,认为生产过程异常这些控制限的设定基于正态分布理论风险评估应用在金融风险管理中,投资组合收益率常被假设服从正态分布通过中心极限定理,多种资产收益的组合近似正态,便于风险度量和管理第六章数理统计的基本概念总体与样本总体是研究对象的全体,样本是从总体中抽取的部分个体,是统计推断的基础统计量由样本构造的不含未知参数的函数,用于描述样本特征和进行统计推断抽样分布统计量的概率分布,是统计推断理论的核心,包括χ²分布、t分布、F分布等抽样方法从总体中选取样本的方法,包括简单随机抽样、分层抽样、系统抽样等总体与样本
6.1总体概念样本概念总体是具有某种共同特征的所有样本是从总体中按一定方式抽取个体的集合,是研究的对象总的若干个体,样本容量是样本中体可以是有限的,如某班学生的个体的数目样本应该能够代表身高;也可以是无限的,如某种总体的特征产品的质量指标简单随机样本满足独立性和同分布性的样本,是最重要的抽样方式每个个体被抽到的概率相等,各次抽取相互独立统计量
6.2̄X样本均值X̄=X₁+X₂+...+X/n是总体均值的无偏估计ₙS²样本方差S²=ΣXᵢ-X̄²/n-1是总体方差的无偏估计S样本标准差S=√S²衡量样本数据的离散程度Mₖ样本矩M=ΣXᵢᵏ/n是总体k阶矩的估计量ₖ抽样分布
6.3χ²分布用于总体方差的推断,自由度为n-1t分布用于总体均值的推断,当总体方差未知时替代正态分布F分布用于两个总体方差比的推断,在方差分析中应用广泛这些分布都与正态分布密切相关抽样方法
6.4简单随机抽样每个个体被抽到的概率相等,是最基本的抽样方法,理论性质最好系统抽样按固定间隔抽取样本,操作简便,但需注意周期性偏差问题分层抽样先分层再抽样,提高估计精度,适用于总体内部差异较大的情况整群抽样先抽取群体再调查群内所有个体,降低调查成本,但精度可能较低第七章参数估计点估计估计量评价用样本统计量估计总体参数的具体数值评价估计量优劣的标准•矩估计法•无偏性12•最大似然估计法•有效性•最小二乘法•一致性样本容量区间估计确定所需样本量的方法给出参数可能取值的区间范围•精度要求43•置信区间•置信水平•置信水平•成本考虑•精度控制点估计
7.1矩估计法用样本矩估计总体矩,方法简单直观•理论基础大数定律•计算简便•不一定是最优估计最大似然估计法选择使样本出现概率最大的参数值•理论性质优良•大样本下渐近最优•计算可能较复杂最小二乘估计法最小化残差平方和的估计方法•适用于回归分析•几何意义明确•计算相对简单估计量的评价
7.2一致性样本量增大时估计量收敛到真值有效性在无偏估计量中方差最小无偏性估计量的期望等于被估参数的真值无偏性要求估计量不存在系统偏差,是最基本的要求有效性在无偏估计量中选择方差最小者,反映估计精度一致性保证大样本下的收敛性,是渐近性质Cramér-Rao不等式给出了无偏估计量方差的下界常见分布参数的点估计
7.3分布类型参数矩估计最大似然估计正态分布Nμ,σ²μ,σ²X̄,S²X̄,ΣXi-X̄²/n二项分布Bn,p pX̄/n X̄/n泊松分布PλλX̄X̄指数分布Expλλ1/X̄1/X̄均匀分布Ua,b a,b X̄±√3S X1,Xn对于正态分布,样本均值和样本方差都是相应总体参数的良好估计量二项分布和泊松分布的参数估计非常直观指数分布参数的估计涉及倒数关系均匀分布的最大似然估计使用次序统计量区间估计
7.4置信区间概念包含未知参数的随机区间,以一定概率覆盖真值置信水平置信区间包含真参数的概率,常用95%或99%单侧与双侧根据问题需要选择单侧或双侧置信区间正态总体估计均值和方差的置信区间构造方法样本容量的确定
7.5第八章假设检验检验思想假设检验是统计推断的重要方法,通过样本信息对总体参数或分布做出判断基于小概率事件原理,在原假设成立条件下计算检验统计量检验步骤建立原假设和备择假设,选择检验统计量,确定拒绝域,根据样本观测值做出统计决策整个过程需要控制犯错误的概率实际应用假设检验在质量控制、医学研究、市场调研等领域有广泛应用,为科学决策提供了重要的统计工具和理论依据假设检验基本概念
8.1假设设定检验统计量拒绝域原假设H₀是待检验的假由样本构造的用于检验的当检验统计量落入此区域设,备择假设H₁是原假设统计量,在原假设成立时时拒绝原假设拒绝域的的对立面通常希望证明其分布已知,是做出决策确定基于显著性水平α的结论作为备择假设的依据值方法pp值是在原假设成立条件下观测到当前样本结果或更极端结果的概率,p值越小越有理由拒绝原假设正态总体均值的检验
8.21单样本检验2两样本检验检验总体均值是否等于某个特比较两个总体均值是否相等定值当总体方差已知时使用需要考虑方差是否相等和样本Z检验,未知时使用t检验样是否独立,分别使用不同的检本量大时可近似使用Z检验验统计量和自由度3配对检验对于配对数据,检验配对差值的均值是否为零这种方法能有效控制个体差异的影响,提高检验的功效正态总体方差的检验
8.3单个方差检验两个方差比检验检验总体方差是否等于某个指定值,使用χ²检验检验统计量为比较两个正态总体的方差是否相等,使用F检验检验统计量为n-1S²/σ₀²,在原假设成立时服从自由度为n-1的χ²分布两个样本方差的比值S₁²/S₂²,服从F分布χ²分布不对称,因此双侧检验的拒绝域需要分别在分布的两端确F检验对正态性假设比较敏感,实际应用中需要注意总体分布的定临界值正态性检验。
个人认证
优秀文档
获得点赞 0