还剩58页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
概率论教学课件欢迎来到概率论课程!本课程将带领大家进入随机性与不确定性的数学世界概率论是研究随机现象数量规律的数学分支,是现代数学的重要组成部分,也是数理统计学的基础在这个信息爆炸的时代,不确定性无处不在从金融风险评估到人工智能算法,从医学研究到气象预报,概率论的应用遍布各个领域通过本课程的学习,你将掌握分析随机现象的基本工具和方法让我们一起踏上这段探索随机世界规律的旅程!课程介绍概率论的重要性课程目标概率论是现代科学技术和社会通过本课程学习,学生将掌握经济发展的重要数学工具,广概率论的基本概念、基本理论泛应用于人工智能、大数据分和基本方法,培养概率统计思析、金融工程、生物医学等领想,提高用概率统计方法分析域掌握概率论思想和方法,和解决实际问题的能力,为后能够帮助我们分析和解决实际续专业课程学习和科学研究奠问题中的不确定性定基础学习要求本课程要求学生具备高等数学(微积分、线性代数)基础,能够认真听课、按时完成作业,积极参与课堂讨论,培养自主学习能力课程采用平时成绩和期末考试相结合的方式进行考核评估第一章概率论基本概念随机试验在相同条件下可重复进行的试验,结果不确定但有稳定的统计规律样本空间随机试验的所有可能结果构成的集合随机事件随机试验结果的某种特性,对应样本空间的子集概率随机事件发生可能性的数量度量第一章我们将从这些基本概念出发,建立概率论的思维框架通过学习这些概念,我们能够用数学语言精确描述随机现象,为后续章节打下坚实基础随机试验定义特点随机试验是指在相同条件下可重复进行•可重复性在相同条件下可以重复进的、结果不确定但有一定统计规律性的行试验它是概率论研究的对象,是建立•不确定性每次试验的结果不能事先概率模型的第一步确定•稳定性大量重复试验具有稳定的频率分布•可观察性试验结果可以被观察和记录示例•投掷硬币或骰子•抽取扑克牌•产品质量检验•股票价格波动•自然灾害的发生样本空间定义样本空间是随机试验的所有可能结果构成的集合,通常用符号Ω表示样本空间中的每个元素称为样本点,代表一个基本结果构造方法根据试验特点确定所有可能的基本结果;分析试验过程,确定样本点的表示方法;列出所有可能的样本点,构成样本空间构造时需考虑试验的复杂度和研究目的示例投掷一颗骰子;投掷两枚硬币正Ω={1,2,3,4,5,6}Ω={,正正反反正反反;随机选取一人测量身高,,,,,,}Ω={x|,为连续样本空间x0}随机事件定义分类随机事件是随机试验结果的某种特性,对必然事件、不可能事件、基本事件和复合应样本空间的子集事件Ω概率赋值表示方法每个事件都可以赋予一个概率值,表示其通常用大写字母、、等表示,也可A BC发生的可能性用集合表示法理解随机事件是学习概率论的关键在概率论中,我们研究的正是随机事件发生的可能性及其规律随机事件可以是单一结果(如掷骰子得到点),也可以是多个结果的组合(如掷骰子得到偶数点)6事件间的关系包含关系相等关系互斥关系如果事件发生必导致事件发生,则称事如果事件包含于事件,且事件也包含如果事件与事件不可能同时发生,则称A B A B B A B件包含于事件,记为⊂从集合角于事件,则称事件与事件相等,记为事件与事件互斥或互不相容,记为A B A B A A BA B度看,是的子集从集合角度看,与包含完全相从集合角度看,与没有公共A BA=BA BA∩B=∅A B同的样本点样本点例如掷骰子得到点包含于得到偶数6A点,因为是偶数,当事件发生时,例如从一副扑克牌中抽到红心与抽例如掷骰子得到奇数点与得到偶数B6A A A事件必然发生到红色花色中的一种相等点是互斥事件B BB事件的运算和事件(并)积事件(交)差事件事件A与事件B的和事件,记事件A与事件B的积事件,记事件A与事件B的差事件,记为A∪B,表示事件A与事件为A∩B或AB,表示事件A与为A-B,表示事件A发生但B至少发生一个从集合角事件B同时发生从集合角事件B不发生从集合角度度看,A∪B包含A或B中的度看,A∩B只包含同时属于看,A-B只包含属于A但不所有样本点A和B的样本点属于B的样本点互斥事件事件A的对立事件,记为Ā,表示事件A不发生从集合角度看,Ā包含样本空间中不属于A的所有样本点满足A∪Ā=Ω,A∩Ā=∅频率与概率概率的定义随机事件发生可能性的数量度量,满足三条公理频率的定义事件在次试验中发生的次数与总试验次数之比n频率与概率的关系频率是估计概率的重要手段在大量重复试验中,随机事件的频率具有稳定性,即当试验次数足够大时,事件的频率会稳定在某一常数附近,这个常数就是该事件的n概率这就是概率的统计定义,也称为大数定律的思想从公理化角度,概率是定义在样本空间上的一种测度,满足三个基本条件非负性、规范性和可加性基于这些公理,可以推导出概率的所有性质和计算公式古典概型31/6定义条件骰子概率有限个基本结果;等可能性;概率计算公式掷一颗均匀骰子得到指定点数的概率1/2硬币概率抛一枚均匀硬币得到正面的概率古典概型是概率论中最基本的概率模型,适用于满足等可能性条件的随机试验在这类试验中,每个基本结果的概率相等,均为1/N,其中N是样本空间中基本结果的总数古典概型的概率计算公式为PA=事件A包含的基本结果数/样本空间中基本结果总数=m/N这种计算方法简单直观,常用于掷骰子、抛硬币、抽牌等问题,但要求试验的基本结果是有限的且等可能的几何概型定义特点应用实例几何概型是指样本空间具有连续性、等可能样本空间含有无穷多个样本点;样本空间中布丰投针问题随机投一根长度为的针在L性的概率模型在几何概型中,随机试验的任一点的概率为零;事件的概率由几何度量间距为的平行线上,针与平行线相ddL结果对应几何空间中的点,事件对应几何图之比确定;概率计算公式为事件交的概率为;随机选择圆内一点,PA=A2L/πd形,概率由几何度量(长度、面积、体积等)对应的度量样本空间对应的度量该点落在内接正方形中的概率为/2/π的比值给出条件概率计算方法性质基本公式法直接使用定义式PA|B=定义条件概率满足概率的所有性质非负性、规范计算;画树形图对于复杂的多步PAB/PB在事件B已经发生的条件下,事件A发生的概率,性和可加性对任意事件A,当PB0时,有骤试验,可以画出概率树,逐步计算条件概率;记为PA|B其定义式为PA|B=0≤PA|B≤1;PΩ|B=1;对互不相容的事件使用全概率公式和贝叶斯公式PAB/PB,其中PB0条件概率是在新序列{Ai},有P∪Ai|B=∑PAi|B的信息条件下,对事件概率的修正乘法公式1一般形式2两个事件的乘法公式多个事件同时发生的概率等于第一两个事件、同时发生的概率等A B个事件的概率乘以在第一个事件发于事件的概率乘以在事件发生AA生条件下第二个事件的条件概率,条件下事件的条件概率,或等于B再乘以在前两个事件都发生条件下事件的概率乘以在事件发生条BB第三个事件的条件概率,依此类推件下事件的条件概率APAB=PA·PB|A=PA₁A₂...Aₙ=PB·PA|BPA₁·3P独A立₂|事A件的乘法公式₁若事件、相互独立,则它们同时发生的概率等于各自概率的乘积这是乘法AB·公式的特殊情况,此时PB|A=PBPA₃|A₁A₂P A·.B..·=P PAAₙ|A·₁PA₂B...Aₙ₋₁全概率公式贝叶斯公式贝叶斯公式是从结果推断原因的重要工具,用于计算在观察到事件发生后,事件发生的后验概率公式表达式为ABᵢPBᵢ|A PBᵢ|A=[PBᵢPA|Bᵢ]/[∑PBⱼPA|Bⱼ]贝叶斯公式广泛应用于医学诊断、模式识别、机器学习、垃圾邮件过滤、法医鉴定等领域它将先验概率根据新信息更新为后验概PBᵢA率,体现了认知过程中不断修正的特点,是概率论中最具哲学意义的公式之一PBᵢ|A事件的独立性定义判断方法重要性若事件与满足,则定义法直接验证是否独立性是概率论中的核心概念,是构建复ABPAB=PAPB PAB=PAPB称事件与相互独立独立性表示一个事成立;杂概率模型的基础在实际问题中,通常AB件的发生与否不影响另一个事件的概率通过假设事件独立来简化计算条件概率法验证或PB|A=PB PA|B是否成立;独立事件的乘法公式使=PA PAB=PAPB独立性与互斥性是两个不同的概念互斥得复杂事件的概率计算变得简单,是许多物理意义法分析事件之间是否存在因果事件指两个事件不能同时发生,即概率应用的基础PAB关系或影响若且,则互斥事件=0PA0PB0一定不独立第二章随机变量及其分布随机变量的概念样本空间到实数集的映射,将随机现象数量化概率分布描述随机变量取值及其概率的数学模型离散型随机变量可列个取值的随机变量,如掷骰子点数连续型随机变量取值为区间的随机变量,如身高、时间特征量描述分布特征的数字,如期望和方差随机变量的概念定义离散型随机变量连续型随机变量随机变量是定义在样本空间上的实值取值为有限个或可列无穷多个的随机变取值为连续区间的随机变量称为连续型Ω函数,记为,∈它将随量称为离散型随机变量其特点是取值随机变量其特点是在任何区间上有无X=XωωΩ机试验的每个可能结果映射为一个实集合是离散的,可以一一列举,如掷骰穷多个可能取值,如某零件的长度、等ω数,实现了从定性描述到定量分析子的点数、某地区一天内的交通事故数车时间、人的身高等物理量Xω的转变等离散型随机变量的分布律X01234PX=x
0.
10.
20.
30.
250.15分布律(概率质量函数)是描述离散型随机变量取值及其概率的基本方式,通常表示为,其中是随机变量的可能取值,是相应的概率分布律PX=xᵢ=pᵢxᵢpᵢ可以用表格、函数表达式或概率直方图表示分布律满足两个基本性质非负性,对所有的,都有;规范性,所有可能i pᵢ≥0取值的概率之和等于,即通过分布律,可以计算随机变量落在任意集1∑pᵢ=1合中的概率,∈∈PX A=∑{i:xᵢA}pᵢ连续型随机变量的概率密度定义性质与分布函数的关系概率密度函数是描述连续型随机变量分非负性对所有,;规范性概率密度是分布函数的导数;fx xfx≥0fx=Fx布的数学函数,满足且;连续点处的几何意义表分布函数是概率密度的积分fx≥0∫fxdx=1∫fxdx=1fx₀Fx=∫[-随机变量落在区间的概率为示随机变量在附近的概率密度;单点概率掌握这种关系有助于在两种表X[a,b]x₀∞,x]ftdt为零对任意点,示方法之间转换Pa≤X≤b=∫[a,b]fxdx x₀PX=x₀=0分布函数定义随机变量的分布函数定义为,表示随机变量不超过的X Fx=PX≤x X x概率分布函数完整描述了随机变量的概率分布,是研究随机变量的基本工具性质单调不减若,则;有界性,且x₁x₂Fx₁≤Fx₂0≤Fx≤1,;右连续性对任意,有lim[x→-∞]Fx=0lim[x→+∞]Fx=1x₀lim[x→x₀⁺]Fx=Fx₀应用计算区间概率;确定分位数若PaX≤b=Fb-Fa Fxp,则为的分位数;分布函数是连接离散型和连续型随机变=p xpX p量的桥梁,对所有类型的随机变量都适用常见离散型分布(上)分布(伯努利分布)二项分布0-1描述单次试验中成功与失败的随机变量,其取值为(失败)或描述次独立重复伯努利试验中成功次数的随机变量,记作01n(成功)X~Bn,p分布律,,其中是成功概率分布律,PX=1=p PX=0=1-p pPX=k=Cn,kp^k1-p^n-k k=0,1,2,...,n期望期望EX=p EX=np方差方差DX=p1-p DX=np1-p应用抛硬币、产品是否合格、单次投篮是否得分等二值结果的应用次投篮命中次、个产品中有个合格、人中有人患某n kn kn k试验种疾病等常见离散型分布(下)泊松分布描述单位时间(空间)内随机事件发生次数的分布,记作分布律X~Pλ,,其中是强度参数期望和方差都PX=k=λ^ke^-λ/k!k=0,1,2,...λ0等于λ泊松分布常用于描述罕见事件发生次数,如某地区一天内发生的交通事故数、电话交换机一小时内收到的呼叫数等当很大而很小时,二项分布可n pBn,p以用泊松分布近似Pλ=np几何分布描述首次成功所需的伯努利试验次数,记作分布律X~Gp PX=k=1-,,其中是单次试验成功的概率期望,方差p^k-1p k=1,2,3,...p EX=1/pDX=1-p/p²几何分布具有无记忆性,意味着已经失败次的PXm+n|Xm=PXn m条件下,再失败次的概率等于一开始就失败次的概率应用包括抛硬币直到n n出现正面所需的次数、射击直到命中靶心所需的次数等常见连续型分布(上)均匀分布指数分布描述随机变量在区间[a,b]上均匀分布的情况,记作X~U[a,b]概率密度函数描述随机事件之间的等待时间,记作X~Expλ概率密度函数fx=fx=1/b-a,a≤x≤b;fx=0,其他分布函数Fx=0,xb期望λe^-λx,x0;fx=0,x≤0,其中λ0是参数分布函数Fx=0,EX=a+b/2,方差DX=b-a²/12x≤0;Fx=1-e^-λx,x0期望EX=1/λ,方差DX=1/λ²均匀分布常用于模拟随机数生成、近似误差分布等指数分布具有无记忆性,适合描述寿命、等待时间等,如电子元件的寿命、顾客到达商店的时间间隔等指数分布与泊松分布有密切关系若事件发生次数服从参数为λ的泊松分布,则事件之间的等待时间服从参数为λ的指数分布常见连续型分布(下)正态分布最重要的连续分布,符合自然现象的变异规律概率密度函数fx=1/√2πσ²e^-x-μ²/2σ²,-∞参数与特征3参数μ位置和σ尺度,记作X~Nμ,σ²标准正态分布4μ=0,σ=1的特例,记作Z~N0,1正态分布是自然和社会现象中最常见的分布,由于中心极限定理,大量独立随机因素叠加的结果近似服从正态分布其概率密度函数的图形呈钟形曲线,关于x=μ对称,在x=μ处取最大值标准正态分布的分布函数通常记为Φz,无法用初等函数表示,需要查表或计算器求值任何正态分布X~Nμ,σ²都可以通过标准化变换Z=X-μ/σ转化为标准正态分布,这大大简化了正态分布的概率计算随机变量的函数随机变量的函数也是随机变量对于离散型随机变量,其函数的分布律可以直接通过变量替换得到Y=gX X Y=gX PY=y=实际计算时,需要找出取哪些值时等于,然后将这些概率相加∑{x:gx=y}PX=x XgX y对于连续型随机变量,若函数单调,则的概率密度可以通过变量替换公式求得,其中X gx Y=gX f_Yy=f_Xx·|dx/dy|x=g^-,是导数绝对值(雅可比行列式)若不单调,需要分段处理或使用分布函数方法先求,1y|dx/dy|gx F_Yy=PY≤y=PgX≤y再求导得到f_Yy第三章多维随机变量及其分布多维随机变量由多个随机变量组成的向量X,Y,...联合分布描述多个随机变量共同分布规律的数学模型边缘分布多维随机变量中单个变量的分布规律条件分布在一些变量取特定值的条件下其余变量的分布随机变量的独立性变量之间是否相互影响的数学表征二维随机变量定义离散型二维随机变量二维随机变量是由两个随机若和都是离散型随机变量,则X,Y X Y变量和组成的向量,表示随机是离散型二维随机变量其X Y X,Y试验的两个方面每次试验同时分布律为PX=x_i,Y=y_j=观察到一对值,对应平面上,表示取值为且取值x,y p_{ij}Xx_i Y的一个点二维随机变量是研究为的概率分布律满足y_j p_{ij}≥多个随机因素相互关系的基础且0∑∑p_{ij}=1连续型二维随机变量若存在非负函数使得任意平面区域上的概率∈∬fx,y DPX,Y D=_D,则是连续型二维随机变量,称为联合概率密度函fx,ydxdy X,Y fx,y数概率密度满足且∬fx,y≥0fx,ydxdy=1联合分布函数定义性质二维随机变量的联合分布函数定义为单调性若且,则X,Y x₁≤x₂y₁≤y₂,表示不超过且;有界性;Fx,y=PX≤x,Y≤y XxYFx₁,y₁≤Fx₂,y₂0≤Fx,y≤12不超过的概率右连续性对和分别右连续y Fx,y x y计算方法与概率的关系离散型,求和范围为Fx,y=∑∑p_{ij}矩形区域概率<<Pa X≤b,c Y≤d=且;连续型x_i≤xy_j≤y Fx,y=,通过分布Fb,d-Fb,c-Fa,d+Fa,c,积分范围为到和到∫∫fs,tdsdt-∞x-∞y函数的差分计算边缘分布定义求解方法与联合分布的关系在二维随机变量中,单个随机变量对于离散型随机变量,边缘分布律为边缘分布可以从联合分布导出,但反之则X,Y X或的分布称为边缘分布边缘分布函数不然知道和的边缘分布,一般无法Y X YPX=x_i=∑_j PX=x_i,Y=y_j=∑_j为确定它们的联合分布,除非和独立F_Xx=PX≤x=PX≤x,Y+∞X Yp_{ij},=Fx,+∞F_Yy=PY≤y=PX+∞,Y≤y=F+∞,yPY=y_j=∑_i PX=x_i,Y=y_j=∑_i如果和独立,则联合分布可以由边缘X Yp_{ij}边缘分布描述了在不考虑另一个变量的情分布的乘积表示况下,单个随机变量的概率规律对于连续型随机变量,边缘概率密度为PX=x_i,Y=y_j=PX=x_iPY=y_j(离散型)f_Xx=∫fx,ydy(连续型)fx,y=f_Xxf_Yyf_Yy=∫fx,ydx条件分布定义计算方法应用条件分布描述在一个随对于已知联合分布和边条件分布是研究随机变机变量取特定值的条件缘分布的情况,直接使量之间相互关系的重要下,另一个随机变量的用定义式计算对于条工具,广泛应用于统计分布规律对于离散型件分布函数,可以通过推断、时间序列分析、随机变量,条件分布律条件概率的定义求得贝叶斯分析等领域通为过条件分布,可以利用PX=x_i|Y=y_j=F_{X|Y}x|y=,然后对已知信息改进对未知量PX=x_i,Y=y_j/PY=PX≤x|Y=y x对于连续型随机求导得到条件概率密度的估计,实现从观测值y_j变量,条件概率密度为(连续型)或直接求得到预测值的过渡条件分布律(离散型)f_{X|Y}x|y=,其中fx,y/f_Yyf_Yy0随机变量的独立性12定义等价条件(离散型)若对任意x和y,有PX≤x,Y≤y=对任意x_i和y_j,有PX=x_i,Y=y_j=PX≤xPY≤y,则称随机变量X和Y相互独立PX=x_iPY=y_j3等价条件(连续型)对几乎所有x,y,有fx,y=f_Xxf_Yy随机变量的独立性是概率论中最重要的概念之一独立性表明一个随机变量的取值不影响另一个随机变量的分布规律判断随机变量是否独立,可以通过验证联合分布函数是否等于边缘分布函数的乘积独立性与不相关性是不同的概念独立性表示完全的统计独立,而不相关仅表示线性无关(协方差为0)独立一定不相关,但不相关不一定独立例外情况是二维正态分布,对它而言,不相关等价于独立二维正态分布定义性质若二维随机变量的联合概率密度为X,Y二维正态随机变量的边缘分布也是正态分布fx,y=1/2πσ₁σ₂√1-ρ²·exp{-1/21-12,;任意线性组合X~Nμ₁,σ₁²Y~Nμ₂,σ₂²ρ²[x-μ₁²/σ₁²-2ρx-μ₁y-μ₂/σ₁σ₂+也服从正态分布;是和的相关系aX+bYρX Y则称服从二维正态分布,y-μ₂²/σ₂²]}X,Y数;当且仅当时,和独立ρ=0X Y记为X,Y~Nμ₁,μ₂,σ₁²,σ₂²,ρ应用条件分布二维正态分布广泛应用于多变量统计分析、回若服从二维正态分布,则在给定X,Y X Y=y43归分析、时间序列分析等领域它是构建高维的条件下仍然服从正态分布,其条件期望为正态分布的基础,也是研究随机变量相关性的,条件方差为EX|Y=y=μ₁+ρσ₁y-μ₂/σ₂重要模型,且与的值无关DX|Y=y=σ₁²1-ρ²y第四章随机变量的数字特征数学期望1随机变量的平均值,表示中心位置方差和标准差描述随机变量的离散程度协方差和相关系数3衡量两个随机变量之间的相关性矩和特征函数全面描述随机变量分布的特征量不等式5概率集中的定量描述数学期望定义离散型随机变量的数学期望定义为,其中求和范围是的X EX=∑x_i PX=x_i X所有可能取值;连续型随机变量的数学期望定义为,其中积分X EX=∫x fxdx范围是的全部取值区间数学期望是随机变量的加权平均值,反映了随机变量X的平均水平性质线性性;常数的期望;独立性若EaX+bY=aEX+bEY Ec=c和独立,则这些性质使得期望的计算变得简便应注XYEXY=EXEY意,当和不独立时,一般;当为非线性函数时,一XYEXY≠EXEY gx般E[gX]≠g[EX]计算方法直接法使用定义式计算;换元法对于,Y=gX EY=(离散型)或(连续型);特殊分布∑gx_iPX=x_i EY=∫gxfxdx的期望利用已知分布的特征,如二项分布的期望为Bn,p np方差12定义计算公式随机变量X的方差定义为DX=VarX=E[X-DX=EX²-[EX]²,简化了方差的计算EX²],度量随机变量取值的离散程度3主要性质非负性;常数的方差为零;方差的线性性质方差是描述随机变量波动或离散程度的最重要特征数方差越大,表示随机变量的取值越分散,偏离期望的程度越大;方差越小,表示随机变量的取值越集中于期望附近方差的单位是随机变量单位的平方,这使得方差在物理意义上不直观方差的主要性质包括非负性,DX≥0,当且仅当X为常数时DX=0;常数的方差,Dc=0;线性变换下的方差,DaX+b=a²DX;独立随机变量和的方差,若X和Y独立,则DX+Y=DX+DY注意,对于一般随机变量,DX+Y=DX+DY+2CovX,Y标准差定义意义随机变量的标准差定义为方差的算标准差表示随机变量在多大程度上偏X术平方根,记为标准离其期望值在正态分布中,约σX=√DX差与原随机变量具有相同的量纲,使的取值落在期望值一个标准差68%其在物理意义上更加直观标准差是范围内,约的取值落在两个标95%衡量随机变量波动性的重要指标准差范围内,约的取值落在
99.7%三个标准差范围内,这就是著名的三西格玛法则与方差的关系标准差是方差的平方根,具有与方差相同的性质对于线性变换,σaX+b=;对于独立随机变量,一般不满足可加性,即|a|σXσX+Y≠σX+σY标准差通常记为或,是统计描述、质量控制、金融风险管理等领域的重要指σSD标协方差相关系数定义相关系数是协方差的标准化度量,定义为ρX,Y=,其中和分别是和的标准差相关CovX,Y/[σXσY]σXσY XY系数消除了量纲影响,范围在之间[-1,1]性质对称性;范围;线性不变性对于ρX,Y=ρY,X-1≤ρX,Y≤1为常数且,有;独立性若和a,b,c,d ac0ρaX+b,cY+d=ρX,Y X独立,则(反之不一定)YρX,Y=0应用相关系数衡量线性相关强度表示完全线性相关;表示线|ρ|=1|ρ|=0性不相关;表示部分线性相关,越大相关性越强在统计0|ρ|1|ρ|建模、金融分析、数据挖掘等领域有广泛应用矩原点矩中心矩与期望、方差的关系随机变量的阶原点矩定义为随机变量的阶中心矩定义为一阶原点矩数学期望X kX k=(离散型)二阶中心矩方差EX^k=∑x_i^k PX=x_i E[X-EX^k]=(连续型)中心矩描述了随机变量围绕期望的分布特二阶原点矩与方差的关系EX^k=∫x^k fxdx征特别地,二阶中心矩就是方差;DX其中为正整数特别地,一阶原点矩k EX EX^2=DX+[EX]^2三阶中心矩与偏度有关,衡量分布的对称就是数学期望性;四阶中心矩与峰度有关,衡量分布尾矩存在定理若随机变量的阶矩存在,X k部的厚度则其所有低于阶的矩也存在k切比雪夫不等式定理内容证明对于任意随机变量,若其期望和方设随机变量,则XEXY=X-EX²EY=1差存在,则对于任意正数,有,应用马尔可夫不等式即可得到结DXε0DX论P|X-EX|≥ε≤DX/ε²应用推论4分析随机变量的集中性,为大数定律提供,即随机变P|X-EX|ε1-DX/ε²3理论基础,广泛应用于统计推断和误差分量在期望附近集中的概率有下界析第五章大数定律和中心极限定理大数定律中心极限定理统计应用大数定律揭示了随机现象在大量重复观察中中心极限定理阐述了大量独立随机因素的综这两个定理构成了统计学的理论基础,使我所呈现的稳定性它表明当观察次数足够多合作用趋向于正态分布的规律不论原始分们能够从有限样本推断总体特征,建立置信时,样本均值将接近总体期望这一规律解布如何,只要样本量足够大,样本均值的分区间,进行假设检验等它们贯穿于医学研释了为什么频率会稳定在概率附近,为频率布近似服从正态分布这一定理是统计推断究、质量控制、金融分析、社会调查等各个概念提供了理论基础的基础,解释了自然界中正态分布的广泛存应用领域,是联系理论与实践的桥梁在大数定律概述含义重要性大数定律是概率论中最重要的大数定律是频率与概率联系的极限定理之一,它揭示了随机理论基础,解释了为什么随机变量序列的算术平均值收敛于事件的频率在大量重复试验中期望的规律简单来说,当样趋于稳定它为统计推断提供本量足够大时,样本均值将非了理论支持,保证了用样本统常接近总体均值,反映了随机计量估计总体参数的合理性现象的统计稳定性大数定律也是风险管理的基础,如保险原理应用大数定律在众多领域有广泛应用统计抽样调查、蒙特卡洛模拟方法、保险精算、金融风险管理、质量控制等例如,保险公司通过承保大量保单,使总体赔付接近预期值,从而保证经营稳定切比雪夫大数定律定理内容1相互独立且方差有界的随机变量序列的算术平均值依概率收敛于其期望的算术平均值条件假设随机变量序列{X₁,X₂,...,Xₙ,...}相互独立,具有有限方差σᵢ²,且存在常数C使得σᵢ²≤C数学表达3对任意ε0,有limn→∞P|S̄ₙ-Ē|ε=1,其中S̄ₙ=X₁+...+Xₙ/n,Ē=EX₁+...+EXₙ/n特殊情况若随机变量具有相同期望μ,则S̄ₙ依概率收敛于μ伯努利大数定律辛钦大数定律定理内容设随机变量序列{X₁,X₂,...,Xₙ,...}相互独立同分布,且数学期望EXᵢ=μ存在,则随机变量序列的算术平均值依概率收敛于,即对任意S̄ₙ=X₁+X₂+...+Xₙ/nμ,有ε0limn→∞P|S̄ₙ-μ|ε=1证明证明思路基于特征函数或矩母函数关键步骤包括计算的特征函数,利S̄ₙ用泰勒展开,分析当时特征函数的极限行为,应用连续性定理得出结论n→∞证明显示了为什么独立同分布条件下,均值会稳定在期望周围应用条件相比切比雪夫大数定律,辛钦定理的条件更为宽松只要求随机变量独立同分布且具有有限期望,不需要有限方差这使得辛钦定理适用范围更广,可以处理一些具有较重尾部分布的情况在实际应用中,辛钦定理是预测随机系统长期行为的理论基础中心极限定理概述含义重要性应用中心极限定理是概率论中最重要的定理之中心极限定理是统计推断的理论基础,它中心极限定理在众多领域有广泛应用统一,它揭示了独立随机变量和的分布趋于保证了在样本量足够大时,样本均值近似计抽样调查中的样本均值分析;金融市场正态分布的规律简单来说,在适当条件服从正态分布,从而可以构建置信区间和中的资产价格波动模型;质量控制中的过下,大量相互独立的随机因素之和,经过进行假设检验程能力指数计算;通信系统中的噪声分析;适当的标准化后,其分布近似服从标准正生物医学研究中的临床试验设计等中心极限定理也解释了测量误差、物理观态分布测等服从正态分布的原因,为误差分析提这一定理解释了为什么自然界和社会现象供了理论支持它还是金融数学、保险精例如,在抽样调查中,即使总体分布不是中正态分布如此普遍许多随机现象是多算、信号处理等领域的基础理论正态的,只要样本量足够大,样本均值的种因素共同作用的结果,根据中心极限定分布仍可视为正态分布,这极大简化了统理,这些结果的分布自然趋向正态分布计推断独立同分布的中心极限定理独立同分布的中心极限定理(也称为李亚普诺夫林德伯格中心极限定理)是最基本的中心极限定理定理内容设随机变量序列-{X₁,独立同分布,具有有限期望和有限方差,则随机变量和的标准化变量的分布函数X₂,...,Xₙ,...}μσ²0Sₙ=X₁+X₂+...+XₙSₙ-nμ/σ√n收敛于标准正态分布函数用数学表示,其中是标准正态分布函数这个定理表明,无论原始随机变量的分布如何,limn→∞PSₙ-nμ/σ√n≤x=ΦxΦx只要它们独立同分布且具有有限方差,它们的和经过适当标准化后的分布都会趋于正态分布这一结论对统计推断具有深远影响李雅普诺夫中心极限定理定理内容设随机变量序列{X₁,X₂,...,Xₙ,...}相互独立,EXᵢ=μᵢ,DXᵢ=σᵢ²,记Bₙ²若存在,使得当时,条件成立=σ₁²+σ₂²+...+σₙ²δ0n→∞Lyapunov1/Bₙ^2+δ∑E|Xᵢ-μᵢ|^2+δ→0,则标准化和Sₙ-ESₙ/Bₙ的分布收敛于标准正态分布证明李雅普诺夫定理的证明基于特征函数方法关键步骤是证明标准化和的特征函数收敛于标准正态分布的特征函数利用条件,可以控制e^-t²/2Lyapunov特征函数展开式中的高阶项,从而证明收敛性应用条件李雅普诺夫定理比独立同分布的中心极限定理条件更宽松,它允许随机变量有不同的分布这使得它可以应用于更广泛的场景,如不同精度的测量仪器产生的数据、不同来源的随机信号叠加等条件本质上要求单个随机变Lyapunov量的影响在总体中不能过大棣莫弗拉普拉斯定理-17131812历史背景推广发展棣莫弗首次发现二项分布的正态近似拉普拉斯将定理推广并完善3连续性校正提高近似精度的技术棣莫弗-拉普拉斯定理是中心极限定理的早期形式,它阐述了二项分布与正态分布的关系定理内容若随机变量X~Bn,p服从参数为n和p的二项分布,则当n足够大时,随机变量X-np/√np1-p的分布近似服从标准正态分布这一定理在统计推断中有重要应用,特别是在构建二项比例的置信区间时为提高近似精度,通常采用连续性校正,即对离散值进行±
0.5的调整棣莫弗-拉普拉斯定理可以看作是独立同分布中心极限定理的特例,因为二项随机变量可以表示为n个独立同分布的0-1随机变量之和第六章数理统计基础总体与样本研究对象整体与抽取部分的关系抽样分布2样本统计量的概率分布参数估计点估计与区间估计方法假设检验统计假设的验证程序回归分析变量间关系的建模方法总体与样本定义关系重要性总体()是研究对象的全体,总体与样本的基本关系是整体与部分,总体与样本的区分是统计学的基本概念Population包含研究问题涉及的所有个体或元素总样本是总体的子集理想的样本应具有代在实际研究中,由于时间、成本或物理限体可以是有限的,如某校学生;也可以是表性,即样本特征应能反映总体特征为制,通常无法观测整个总体,必须通过样无限的,如某生产过程中的所有可能产品保证代表性,通常采用随机抽样方法本进行推断统计推断的可靠性取决于样本的质量样样本()是从总体中抽取的一部样本统计量(如样本均值、样本方差)是本的随机性、独立性和足够的样本量是保Sample分个体或元素,用于推断总体特征统计样本的函数,用于估计总体参数(如总体证统计推断有效性的关键因素样本设计推断的核心就是通过样本信息对总体参数均值、总体方差)统计量是随机变量,(包括抽样方法、样本量确定等)是统计进行估计和检验其分布称为抽样分布,是构建统计推断的研究的重要环节基础抽样分布分布分布分布χ²t F若随机变量相互独立且均服若随机变量服从标准正态分布,若随机变量服从自由度为的分布,X₁,X₂,...,XₙX N0,1Y Xn₁χ²Y从标准正态分布,则它们的平方和服从自由度为的分布,且与相互独服从自由度为的分布,且与相互独N0,1nχ²XYn₂χ²XY服从自由度为的分立,则随机变量服从自由度立,则随机变量服从自由X₁²+X₂²+...+Xₙ²nχ²T=X/√Y/n F=X/n₁/Y/n₂布,记为分布的概率密度函数为为的分布,记为当时,分布度为的分布,记为分布χ²nχ²n ttn n→∞t n₁,n₂F Fn₁,n₂F趋近于标准正态分布分布主要用于小样主要用于方差齐性检验和方差分析fx=1/2^n/2Γn/2·x^n/2-1e^-t,主要用于方差的区间估计和拟本条件下均值的区间估计和假设检验x/2x0合优度检验点估计矩估计法矩估计法的基本思想是用样本矩来估计总体矩具体步骤首先建立含有待估参数的总体矩方程;然后用相应的样本矩替代总体矩;最后求解方程得到参数的估计值例如,用样本均值估计总体均值,用样本方差估计总体方差x̄μs²σ²最大似然估计法最大似然估计法基于这样的思想最合理的参数估计值应是使观测到的样本出现概率最大的参数值对于给定的样本,构造似然函数x₁,x₂,...,xₙLθ=,然后求解使或取最大值的参数通常通过求fx₁,x₂,...,xₙ|θLθln Lθθ导并令导数等于零来解决优良估计的准则评价估计量优劣的主要准则包括无偏性(估计量的数学期望等于被估参数的真值);有效性(在无偏估计量中,方差最小的最有效);一致性(当样本量趋于无穷时,估计量依概率收敛于参数真值);充分性(估计量包含样本中关于参数的全部信息)区间估计置信区间置信水平置信区间是包含总体参数真值的随机区间,置信水平表示在重复抽样中,置信区1-α形式为不同于确定性的点估计,间包含参数真值的概率为常用的置[θ₁,θ₂]1-α置信区间提供了参数可能取值的范围,并信水平有和置
0.9595%
0.9999%给出了区间包含参数真值的概率保证信水平越高,置信区间越宽,估计精度越低计算方法样本量的影响构造枢轴量法找到一个包含参数的统θ在给定置信水平下,样本量越大,置信区计量,其分布已知且不依赖于未gX,θ间越窄,估计精度越高这反映了样本信知参数,然后根据的分布特性构gX,θ息量对统计推断质量的影响,也是大样本造置信区间常见的区间包括总体均值的调查优于小样本调查的理论基础置信区间、总体方差的置信区间等假设检验基本思想步骤假设检验是通过样本信息来判断关于假设检验的基本步骤包括提出假设总体的统计假设是否成立的推断方法和;选择适当的检验统计量;H₀H₁其基本思想是先提出关于总体参数确定显著性水平和拒绝域;计算检α的假设(原假设和备择假设),验统计量的值;根据检验统计量是否H₀H₁然后根据样本信息计算检验统计量,落入拒绝域,作出拒绝或不拒绝原假再根据统计量的取值决定是否拒绝原设的决定;给出统计结论假设两类错误假设检验中可能出现两类错误第一类错误(弃真),即原假设正确但被拒绝,H₀其概率为(显著性水平);第二类错误(取伪),即原假设错误但未被拒绝,αH₀其概率为检验的功效定义为,表示当为真时正确拒绝的概率β1-βH₁H₀方差分析回归分析一元线性回归多元线性回归回归分析的统计推断一元线性回归研究一个自变量与一个多元线性回归研究多个自变量回归分析的统计推断包括回归系数的X因变量之间的线性关系回归模型为与一个因变量之间的线性显著性检验,用于判断自变量对因变量YX₁,X₂,...,XₚY,其中和是回归关系回归模型为的影响是否显著;回归方程的显著性检Y=β₀+β₁X+εβ₀β₁Y=β₀+β₁X₁+系数,是随机误差通过最小二乘法参数估计通常验,用于判断回归关系是否显著;决定εβ₂X₂+...+βₚXₚ+ε估计回归系数,使得观测值与预测值之使用矩阵方法,最小二乘估计为系数,表示回归方程对因变量变异的β̂=R²间的平方误差和最小估计值,其中是自变量矩阵,解释程度;预测和控制,使用建立的回β̂₀=ȳ-XX⁻¹XY XYβ̂₁x̄,β̂₁=∑xᵢ-x̄yᵢ-ȳ/∑xᵢ-x̄²是因变量向量归方程进行预测和决策课程总结数理统计应用将概率理论应用于实际数据分析和决策极限定理大数定律和中心极限定理揭示随机现象的内在规律随机变量及其分布3离散分布、连续分布和数字特征概率论基础样本空间、随机事件、概率定义与计算本课程从概率论的基本概念出发,系统讲解了随机事件的概率计算、随机变量及其分布、多维随机变量、随机变量的数字特征、大数定律与中心极限定理,以及数理统计的基本方法概率论为我们认识随机现象、分析不确定性提供了科学工具通过本课程的学习,我们了解了随机现象背后的数学规律,掌握了建立概率模型、计算概率、分析随机变量特征的方法,为后续课程和实际应用奠定了基础学习建议与参考资料学习概率论需要理论与实践相结合建议采用以下学习方法理解基本概念和定理,不仅要知其然,还要知其所以然;多做习题,特别是应用题,培养概率思维;结合实际问题,建立概率模型;使用计算机软件辅助学习,如、、等MATLAB RPython推荐教材和参考书《概率论与数理统计》(陈希孺著);《概率论基础》(钟开莱著);《概率论与数理统计教程》(茆诗松著);《数理统计学教程》(陈希孺著);《概率论与数理统计习题全解指南》(盛骤编)网络资源中国大学平台的相关课程;统计MOOC之都网站;的概率统计课程cos.name KhanAcademy。
个人认证
优秀文档
获得点赞 0