还剩58页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
概率与统计复习课件欢迎参加概率与统计复习课程!本课件将系统地回顾概率论与数理统计的核心概念、理论和方法,帮助你建立扎实的概率统计思维我们将从概率论基础入手,逐步深入随机变量、大数定律、中心极限定理,再到数理统计、回归分析和方差分析等高级主题每个部分都配有详细解释和典型例题,帮助你全面掌握这门重要学科无论你是为考试复习,还是为应用统计方法解决实际问题做准备,这份课件都将是你的得力助手让我们一起开始概率与统计的学习之旅!课程概述概率论与数理统计的重课程内容概览要性本课程分为八大部分概率论概率与统计已成为现代科学研基础、随机变量及其分布、多究与决策分析的基础工具,广维随机变量、随机变量的数字泛应用于工程、金融、医学、特征、大数定律与中心极限定社会科学等众多领域掌握概理、数理统计基础、回归分析率统计思维,能帮助我们在不和方差分析每部分都包含理确定性中做出科学决策论讲解和实例分析学习目标通过本课程的学习,你将掌握概率论与数理统计的基本理论与方法,培养概率统计思维,并能运用相关知识解决实际问题,为进一步学习高级统计方法奠定基础第一部分概率论基础基础概念条件概率与独立性概率论研究随机现象的数学分支条件概率研究事件之间的相互影,关注的是在随机试验中各种可响关系,全概率公式与贝叶斯公能结果出现的概率掌握随机事式是其重要应用事件的独立性件、样本空间、概率定义等基础是概率论中的核心概念,为后续概念是学习的第一步随机变量独立性奠定基础概率计算学习概率的基本性质和计算方法,包括加法公式、乘法公式、全概率公式和贝叶斯公式,以解决各类概率问题这些方法构成了概率论的基本工具箱随机事件确定性现象随机现象在完全相同的条件下重复进行,结果总是相同的现象例如,在相同条件下重复进行,结果可能不同,但长期来看具有一定标准大气压下,纯水在100°C沸腾;释放的物体在重力作用下规律性的现象如掷骰子、抛硬币、股票价格波动等落向地面虽然单次试验结果不可预测,但大量重复试验后,各种结果出确定性现象通常可以用确定性数学模型(如微分方程)精确描现的频率趋于稳定,这种稳定性是概率论研究的基础随机现述,结果可以准确预测物理学、天文学中的许多基本规律就象在生活、科学研究中普遍存在是对确定性现象的描述随机试验的三个主要特点试验可以在相同条件下重复进行;试验的所有可能结果事先已知;任何一次试验的具体结果事先不可预知理解随机性是学习概率的第一步样本空间与事件样本空间的定义样本空间是随机试验中所有可能结果的集合,通常用Ω(大写希腊字母欧米伽)表示样本空间中的每个元素称为样本点,代表试验的一个可能结果样本空间示例例如,掷一颗骰子的样本空间为Ω={1,2,3,4,5,6};抛一枚硬币的样本空间为Ω={正面,反面};投掷两枚硬币的样本空间为Ω={正,正,正,反,反,正,反,反}事件的表示方法事件是样本空间的子集,表示我们关心的某类结果的集合通常用大写字母A,B,C等表示例如,在掷骰子试验中,出现偶数点数的事件可表示为A={2,4,6}基本事件与复合事件只包含一个样本点的事件称为基本事件;包含多个样本点的事件称为复合事件整个样本空间Ω称为必然事件,空集∅称为不可能事件事件的关系与运算相等关系包含关系若A⊂B且B⊂A,则称事件A与事件B相若事件A的每一个样本点都是事件B的等,记作A=B两个事件包含相同的样样本点,则称A包含于B,记作A⊂B本点直观理解事件A发生必导致事件B发和事件生事件A与事件B的和事件A∪B,表示A或B至少有一个发生的事件,包含A或差事件与补事件B中的所有样本点积事件事件A与B的差事件A-B表示A发生但B不发生的事件;事件A的补事件Ac表示事件A与事件B的积事件A∩B,表示AA不发生的事件与B同时发生的事件,由同时属于A和B的样本点组成概率的定义公理化定义满足三条公理的概率函数P,满足非负性、规范性、可加性统计概率大量重复试验中事件出现的频率古典概率等可能事件中有利样本点数与总样本点数之比古典概率适用于有限样本空间且每个基本事件等可能的情况,计算公式为PA=事件A包含的基本事件数/样本空间中基本事件总数如掷骰子出现奇数点的概率PA=3/6=1/2统计概率基于大数定律,通过大量重复试验获得当试验次数n足够大时,事件A发生的频率nA/n接近于某个稳定值,这个值即为事件A的概率PA公理化定义提供了严格的数学基础,不依赖于特定模型,适用范围最广从公理出发,可以推导出概率的各种性质和计算公式概率的性质可加性规范性非负性若事件A与事件B互不相容(即A∩B=∅),必然事件的概率为1,即PΩ=1这确保了概则PA∪B=PA+PB这条性质可推广到有对任意事件A,其概率PA≥0概率是一个率取值的上界,所有事件的概率都不超过1限个或可列个互不相容事件的情况非负实数,表示事件发生的可能性大小基于这三条基本性质,可以推导出其他重要性质
1.不可能事件的概率为0,即P∅=0₁₂₁₂₁₂ₙₙₙ
2.有限可加性若A,A,...,A两两互不相容,则PA∪A∪...∪A=PA+PA+...+PAᶜ
3.对任意事件A,PA=1-PA
4.对任意事件A、B,PA∪B=PA+PB-PA∩B
5.若A⊂B,则PA≤PB且PB-A=PB-PA条件概率条件概率定义在事件B已发生的条件下,事件A发生的概率,记作PA|B其定义公式为PA|B=PA∩B/PB,其中PB0条件概率反映了事件间的相互影响关系乘法公式由条件概率定义可直接推导出乘法公式PA∩B=PB·PA|B=PA·PB|A这一公式在计算复合事件概率时非常有用乘法公式推广₁₂₁₂₁₂₁₃₁₂₁₂ₙₙₙₙ₋₁对于n个事件A,A,...,A的积事件,有PA∩A∩...∩A=PA·PA|A·PA|A∩A·...·PA|A∩A∩...∩A条件概率是概率论中的基本工具,为解决复杂问题提供了途径例如,在医学诊断中,我们关心的不是疾病概率P疾病,而是在观察到某些症状后的条件概率P疾病|症状在实际应用中,条件概率的思想帮助我们更新已有信息后的概率判断全概率公式全概率公式的内容应用例题₁₂ₙ若事件组B,B,...,B构成样本空间Ω的一个完备事件组(某工厂有三台机器A、B、C,它们生产的产品分别占总产量的₁₂₁₂ₙₙ即B,B,...,B两两互不相容且B∪B∪...∪B=Ω)50%、30%和20%已知A、B、C三台机器生产的次品率分别,则对任意事件A,有为3%、2%和1%请问随机抽取一件产品,它是次品的概率₁₁₂₂是多少?ₙₙPA=PB·PA|B+PB·PA|B+...+PB·PA|B₁₂解设事件D为抽到的产品是次品,则ₙ全概率公式将事件A的概率分解为在不同条件B,B,...,B下发生的概率之和它反映了分而治之的思想,将复杂问题PD=PA·PD|A+PB·PD|B+PC·PD|C=分解为简单问题
0.5×
0.03+
0.3×
0.02+
0.2×
0.01=
0.015+
0.006+
0.002=
0.023因此,随机抽取一件产品是次品的概率为
2.3%贝叶斯公式问题起源已知条件概率PA|B,如何计算PB|A?贝叶斯公式解决了这一逆向概率问题公式推导2由条件概率定义PA|B=PA∩B/PB和PB|A=PA∩B/PA,可得PB|A=PA|B·PB/PA一般形式₁₂ᵢₙ对完备事件组B,B,...,B,任意事件APA0,有PBᵢᵢ₁₁ₙₙ|A=PA|B·PB/[PA|B·PB+...+PA|B·PB]ᵢᵢᵢ贝叶斯公式的核心思想是利用新信息更新概率判断在公式中,PB称为先验概率,表示在获得新信息前对B的概率估计;PB|A称为后验概率,表ᵢ示在获得信息A后对B的修正概率贝叶斯公式在医学诊断、模式识别、机器学习等领域有广泛应用例如,在疾病诊断中,P疾病|症状=P症状|疾病·P疾病/P症状通过贝叶斯公式,医生可根据观察到的症状,更准确地推断患者患有某种疾病的概率事件的独立性独立性的定义三个事件的独立性若事件A与B满足PA∩B=PA·PB,三个事件A、B、C相互独立,需满足则称事件A与B相互独立独立性表明一PA∩B=PA·PB,个事件的发生不影响另一个事件发生的PA∩C=PA·PC,概率,即PA|B=PA或PB|A=PB PB∩C=PB·PC,以及PA∩B∩C=PA·PB·PC需要注意,独立性是一种概率关系,与事件是否互不相容没有必然联系实际值得注意的是,前三个条件(两两独立上,若A、B为非零概率事件,且)不足以推出第四个条件完全独立需A∩B=∅,则A、B一定不独立要满足所有条件独立性的应用独立重复试验是概率论中的重要模型例如,在n次独立重复试验中,事件A恰好发生k次的概率计算P=Cn,k·p^k·1-p^n-k,其中p是单次试验中A发生的概率这一模型广泛应用于抽样调查、质量控制、可靠性分析等领域,为二项分布、几何分布等概率分布奠定了基础第二部分随机变量及其分布随机变量概念将样本空间映射到实数集的函数,使随机现象可以用数量表示和分析概率分布描述随机变量取值规律的函数,包括分布函数、概率质量函数和概率密度函数常见分布离散型分布(二项、泊松、几何、超几何)和连续型分布(均匀、指数、正态)实际应用通过选择合适的概率分布模型描述实际问题,进行概率计算和预测随机变量及其分布是连接概率论基础与数理统计的桥梁通过将随机现象数量化,我们可以运用数学工具进行精确分析本部分将介绍各种常见分布的性质和应用场景,为后续学习奠定基础随机变量的概念随机变量的定义离散型随机变量连续型随机变量随机变量是定义在样本空间Ω上,取值取值只有有限个或可列无限多个的随机若存在非负函数fx,使得随机变量X在于实数集R的函数X=Xω,ω∈Ω简单变量称为离散型随机变量它的全部可任意区间[a,b]上的取值概率₁₂来说,随机变量将随机试验的每个可能能取值可以排成一个序列{x,x,...}Pa≤X≤b=∫[a,b]fxdx,则称X为连结果映射为一个实数,使随机现象可以续型随机变量,fx为X的概率密度函数例如掷骰子的点数X∈{1,2,3,4,5,6};用数量表示(PDF)某产品的缺陷数Y∈{0,1,2,...};家庭的例如,投掷硬币3次,可定义随机变量X子女数Z∈{0,1,2,...}离散型随机变量连续型随机变量的任意单点取值概率为为出现正面的次数,则X的取值为通过概率质量函数(PMF)描述其分布零,即PX=c=0常见的连续型随机变{0,1,2,3};测量某人身高的随机变量Y可规律量有等待时间、物体长度、产品寿命取任意正实数值等分布函数分布函数的定义随机变量X的分布函数Fx定义为X小于或等于x的概率,即Fx=PX≤x,x∈R分布函数完整描述了随机变量的概率分布,是研究随机变量的基本工具分布函数的性质₁1单调不减若x2右连续Fx+0=Fx3有界性0≤Fx≤1,且limx→-∞Fx=0,limx→+∞Fx=1离散型分布函数对于离散型随机变量X,其分布函数Fx为阶梯函数,在X的可能取值处有跳跃,跳跃的高度等于该点的概率值PX=xi连续型分布函数对于连续型随机变量X,其分布函数Fx为连续函数,且几乎处处可导,导数Fx=fx为X的概率密度函数分布函数是连接离散型和连续型随机变量的桥梁,无论何种类型的随机变量都有唯一确定的分布函数通过分布函数,可以计算随机变量落在任意区间的概率Pa<X≤b=Fb-Fa离散型随机变量的分布律₁₂ₙ随机变量X xx...x...ᵢ₁₂ₙ概率PX=x pp...p...离散型随机变量X的分布律(也称为概率质量函数PMF)表示X取各个可能值的概率,通常以表格形式给出,如上表所示分布律满足两个基本条件非负性归一性与分布函数的关系ᵢᵢᵢᵢᵢ对任意i,都有p=PX=x≥0概率不可能为负所有可能取值的概率之和为1,即∑p=1这保离散型随机变量的分布函数Fx=∑x≤xp分值证了概率的完备性布函数是分布律的累积形式常见的离散型概率分布包括均匀分布、二项分布、泊松分布、几何分布和超几何分布等不同的分布适用于建模不同类型的随机现象选择合适的分布模型对准确描述实际问题至关重要二项分布分布背景概率质量函数期望与方差二项分布源自n次独立重复伯努利试验(只X~Bn,p的分布律为若X~Bn,p,则EX=np,VarX=np1-有成功和失败两种可能结果的试验),单PX=k=Cn,kp^k1-p^n-k,k=0,1,...,n p期望表示平均成功次数,方差度量了次试验成功概率为p若随机变量X表示n其中Cn,k是组合数,表示从n个元素中实际成功次数与期望的偏离程度次试验中成功的次数,则X服从二项分布选择k个的方式数二项分布的一些重要特性
1.二项分布的形状与参数p有关当p=
0.5时,分布关于x=np对称;当p<
0.5时,分布右偏;当p>
0.5时,分布左偏₁₁₂₂₁₂₁₂₁₂
2.若X~Bn,p,X~Bn,p,且X与X独立,则X+X~Bn+n,p
3.当n足够大且p较小时,二项分布可以用泊松分布近似二项分布广泛应用于质量控制、市场调查、生物实验等领域,是最基本也是最常用的离散型概率分布之一泊松分布λ参数含义泊松分布的参数λ表示单位时间(或空间)内随机事件的平均发生次数e^-λ·λ^k/k!概率公式泊松分布X~Pλ的概率质量函数为PX=k=e^-λ·λ^k/k!,k=0,1,2,...λ期望泊松随机变量的期望等于其参数EX=λλ方差泊松随机变量的方差也等于其参数VarX=λ泊松分布是描述单位时间内随机事件发生次数的重要模型当满足以下条件时,随机变量近似服从泊松分布事件可在任意小的时间间隔内发生;在不重叠的时间间隔内,事件发生次数相互独立;在充分小的时间间隔内,事件发生一次的概率与时间长度成正比,发生两次及以上的概率可忽略不计泊松分布与二项分布的关系当n很大且p很小,而np=λ保持固定时,二项分布Bn,p可近似为泊松分布Pλ这一近似在n≥20且p≤
0.05时效果较好几何分布分布定义在伯努利试验序列中,进行独立重复试验,直到第一次成功出现,所需的试验次数X服从几何分布若单次试验成功概率为p,则X~Gp概率质量函数几何分布X~Gp的分布律为PX=k=1-p^k-1·p,k=1,2,3,...这表示前k-1次试验都失败(概率为1-p^k-1),第k次试验成功(概率为p)期望与方差若X~Gp,则EX=1/p,VarX=1-p/p²例如,掷骰子直到首次出现6点,平均需要掷EX=1/1/6=6次无记忆性几何分布具有无记忆性PXm+n|Xm=PXn,对任意的m,n≥1成立这意味着已经进行了m次试验且尚未成功的条件下,还需额外进行n次以上试验的概率,等于从头开始需要进行n次以上试验的概率超几何分布分布背景概率质量函数从有限总体中不放回抽样时,超几何分布描述了成功元素的数超几何分布Hn,M,N的分布律为量分布具体模型为总体有N个元素,其中M个为成功元素PX=k=CM,k·CN-M,n-k/CN,n,max0,n-N-,从中不放回地抽取n个元素,其中成功元素的个数X服从超几M≤k≤minn,M何分布其中,分子CM,k·CN-M,n-k表示从M个成功元素中选k个、典型例子包括从一副扑克牌中抽取5张,其中红牌的数量;从N-M个失败元素中选n-k个的组合方式数;分母CN,n表示从从一批产品中抽检若干个,其中不合格品的数量等N个元素中选n个的总方式数超几何分布的数字特征若X~Hn,M,N,则EX=n·M/N,VarX=n·M/N·N-M/N·N-n/N-1超几何分布与二项分布的区别与联系二项分布对应有放回抽样或总体容量无限大的情形,而超几何分布对应不放回抽样且总体容量有限的情形当总体容量N远大于样本容量n时通常N≥10n,超几何分布可以用二项分布Bn,p=M/N近似连续型随机变量的概率密度概率密度函数的定义概率密度函数的性质若存在非负函数fx,使随机变量X1非负性对任意x,都有fx≥0在任意区间[a,b]上的概率2归一性∫[-∞,+∞]fxdx=1Pa≤X≤b=∫[a,b]fxdx,则称X为3PX=c=0连续型随机变量取单连续型随机变量,fx为X的概率密点值的概率为零度函数PDF4Pa≤X≤b=Pa<X≤b=Pa≤X概率密度函数描述了随机变量取值的<b=Pa<X<b=∫[a,b]fxdx相对可能性,但需注意fx本身不是概率,而是概率密度与分布函数的关系分布函数Fx=PX≤x=∫[-∞,x]ftdt,即Fx是fx的积分函数对于连续型随机变量,若Fx处处可导,则fx=Fx,即概率密度函数是分布函数的导函数通过这一关系,我们可以在概率密度函数和分布函数之间相互转换均匀分布分布定义基本性质若随机变量X的概率密度函数为fx=1/b-均匀分布的概率密度函数在区间[a,b]上取2a,a≤x≤b,则称X服从区间[a,b]上的常数值1/b-a,表示X落在区间内任意等均匀分布,记作X~U[a,b]长子区间的概率相等期望与方差分布函数若X~U[a,b],则EX=a+b/2,X~U[a,b]的分布函数为Fx=0x<a;VarX=b-a²/12x-a/b-aa≤x<b;1x≥b均匀分布是最简单的连续型概率分布,其特点是随机变量在给定区间内取值的概率密度相等当我们对随机变量的分布没有先验知识,只知道其取值范围时,常假设其服从均匀分布均匀分布的应用例子随机数生成器产生的[0,1]区间内的随机数服从U[0,1];某人约定在12:00到13:00之间到达,若到达时间完全随机,则服从U[12,13];公交车每10分钟一班,乘客随机到达站台的等待时间服从U[0,10]指数分布概率密度函数1若随机变量X的概率密度函数为fx=λe^-λx,x0;fx=0,x≤0,其中λ0为参数,则称X服从参数为λ的指数分布,记作X~Expλ分布函数X~Expλ的分布函数为Fx=0,x≤0;1-e^-λx,x0这意味着PXx=e^-λx,x0,表示随机变量超过某值x的概率随x增大而指数衰减期望与方差若X~Expλ,则EX=1/λ,VarX=1/λ²参数λ可以解释为单位时间内事件发生的平均次数,而1/λ是两次相邻事件之间的平均时间间隔指数分布最重要的特性是无记忆性PXs+t|Xs=PXt,对任意s,t0成立这表示如果某元件已经使用了s小时仍能正常工作,则它再工作t小时的概率与一个全新元件工作t小时的概率相同指数分布与泊松分布有密切关系若事件发生次数服从参数为λ的泊松过程,则相邻两次事件之间的时间间隔服从参数为λ的指数分布指数分布常用于描述寿命、等待时间等随机变量,如电子元件的寿命、顾客到达商店的时间间隔、放射性元素的衰变时间等正态分布概率密度函数标准正态分布若随机变量X的概率密度函数为参数为μ=0,σ=1的正态分布称为标准正态分布,其概率密度函数为fx=1/σ√2π·e^-x-μ²/2σ²,-∞<x<+∞φx=1/√2π·e^-x²/2,-∞<x<+∞其中μ和σ0为参数,则称X服从参数为μ和σ的正态分布(或高斯分布),记作X~Nμ,σ²标准正态分布的分布函数通常记为Φx,即Φx=PZ≤x,其中Z~N0,1由于正态分布的概率密度函数无法用初等函数参数μ是分布的均值,也是概率密度函数的对称中心;参数σ是表示积分,Φx的值通常通过查表或计算器获得标准差,决定了曲线的陡峭程度任何正态分布都可以通过线性变换转换为标准正态分布若X~Nμ,σ²,则Z=X-μ/σ~N0,1这一性质使得我们只需要标准正态分布表,就能计算任意正态分布的概率正态分布是概率论和数理统计中最重要的分布,其重要性源于中心极限定理该定理表明,大量独立同分布的随机变量之和的分布近似服从正态分布,无论这些随机变量本身的分布如何正态分布的性质对称性单峰性与最大值正态分布的概率密度函数关于x=μ对称正态分布的概率密度函数在x=μ处取得,即fμ+x=fμ-x这意味着X偏离均最大值fμ=1/σ√2π曲线呈现单峰值μ的程度相同但方向相反的概率相等形状,从中心向两侧单调递减参数σ实际计算中,可利用PXμ+a=PX越小,峰值越高,曲线越陡峭,随机<μ-a简化计算变量取值越集中在均值附近原则3σ对于正态分布X~Nμ,σ²,有Pμ-σ<X<μ+σ≈
0.6826,Pμ-2σ<X<μ+2σ≈
0.9545,Pμ-3σ<X<μ+3σ≈
0.9973这表明,正态随机变量的取值大约有
99.73%落在距离均值三个标准差的范围内正态分布的线性变换性质若X~Nμ,σ²,则aX+b~Naμ+b,a²σ²,其中a≠0特别地,X的标准化变量Z=X-μ/σ~N0,1₁₁₁₂₂₂₁₂正态分布的可加性若X~Nμ,σ²,X~Nμ,σ²,且X与X相互独立,则₁₂₁₂₁₂X+X~Nμ+μ,σ²+σ²更一般地,n个独立正态随机变量的线性组合仍然服从正态分布在实际应用中,正态分布用于建模测量误差、自然现象(如身高、体重)、金融市场波动等众多场景虽然严格的正态分布在现实中很少出现,但作为近似模型非常有效第三部分多维随机变量多维随机变量联合分布边缘分布多维随机变量是由多个随机变联合分布函数边缘分布是从联合分布中导出量组成的向量,表示随机试验Fx,y=PX≤x,Y≤y描述了随的单个随机变量的分布例如中多个随机量最常见的是二机变量X和Y的联合概率行为,从二维随机变量X,Y的联合维随机变量X,Y,它描述了两对于离散型随机变量,有联合分布可以得到X和Y各自的边缘个随机量X和Y的联合分布规律分布律PX=x,Y=y;对于连续分布,分别描述X和Y的单独概型随机变量,有联合概率密度率行为函数fx,y条件分布条件分布描述了在一个随机变量取特定值的条件下,另一个随机变量的分布例如,Y=y条件下X的条件分布PX=x|Y=y或fx|y,反映了随机变量间的相互影响关系二维随机变量联合分布函数二维随机变量X,Y的联合分布函数定义为Fx,y=PX≤x,Y≤y,表示X≤x且Y≤y的概率联合分布函数完整描述了两个随机变量的概率特性及其相互关系分布函数性质Fx,y关于x和y均单调不减;F-∞,y=Fx,-∞=0,F+∞,+∞=1;Fx,y关于x和y均右连续;对任意矩形区域[a,b]×[c,d],有Pa<X≤b,c<Y≤d=Fb,d-Fa,d-Fb,c+Fa,c离散型联合分布ᵢⱼᵢⱼᵢⱼ若X,Y为离散型随机变量,其联合分布律为PX=x,Y=y=p,满足p≥0且ᵢⱼᵢⱼᵢⱼᵢⱼ∑∑p=1联合分布函数Fx,y=∑∑p,其中和式取满足x≤x且y≤y的所有i,j连续型联合分布ˣ₍₋₎ʸ₍₋₎若存在非负函数fx,y,使得Fx,y=∫∞∫∞fu,vdudv,则称X,Y为连续型随机变量,fx,y为其联合概率密度函数对任意区域D,有ₚPX,Y∈D=∫∫fx,ydxdy边缘分布边缘分布的概念离散型随机变量的边缘分布连续型随机变量的边缘分布边缘分布是从二维随机变量X,Y的联合对于离散型随机变量X,Y,其边缘分布对于连续型随机变量X,Y,其边缘概率分布中导出的单个随机变量X或Y的分布律为密度函数为边缘分布函数分别为ᵢⱼᵢⱼⱼᵢⱼₓ₍₋₎₍₊₎PX=x=∑PX=x,Y=y=∑p f x=∫∞^∞fx,ydyₓF x=PX≤x=PX≤x,Y<+∞=Fx,+∞ⱼᵢᵢⱼᵢᵢⱼᵧ₍₋₎₍₊₎PY=y=∑PX=x,Y=y=∑p f y=∫∞^∞fx,ydxᵧ即X的边缘分布是联合分布律在所有y值即X的边缘密度是联合密度在所有y值上F y=PY≤y=PX<上的求和;Y的边缘分布是联合分布律的积分;Y的边缘密度是联合密度在所+∞,Y≤y=F+∞,y在所有x值上的求和有x值上的积分从几何意义上看,边缘分布是将联合分布在另一个维度上积分或求和而得到的投影条件分布条件分布的定义离散型条件分布条件分布描述了在一个随机变量取特定对于离散型随机变量X,Y,在Y=y条件值的条件下,另一个随机变量的分布下X的条件分布律为它反映了随机变量之间的依赖关系,是PX=x|Y=y=PX=x,Y=y/PY=y,其中研究多维随机变量的重要工具PY=y0从概念上讲,条件分布是条件概率的推同理,在X=x条件下Y的条件分布律为广就像条件概率PA|B描述事件B发PY=y|X=x=PX=x,Y=y/PX=x,其中生条件下事件A的概率一样,条件分布PX=x0描述了随机变量Y=y条件下随机变量X的分布规律连续型条件分布对于连续型随机变量X,Y,在Y=y条件下X的条件概率密度函数为ᵧᵧfx|y=fx,y/f y,其中f y0同理,在X=x条件下Y的条件概率密度函数为ₓₓfy|x=fx,y/f x,其中f x0随机变量的独立性独立性的定义1ₓᵧ随机变量X和Y独立当且仅当Fx,y=F x·F y对所有x,y成立离散型和连续型随机变量的独立性ₓᵧ离散型PX=x,Y=y=PX=x·PY=y连续型fx,y=fx·fy独立随机变量的函数3若X与Y独立,则gX与hY也独立,其中g和h为任意函数随机变量的独立性是概率论中的重要概念,它是事件独立性的延伸两个随机变量独立意味着一个变量的取值不影响另一个变量的概率分布独立性与不相关性的区别独立性蕴含不相关性,但反之不成立如果X与Y独立,则它们一定不相关(即协方差为0);但协方差为0并不能推出X与Y独立,除非它们服从正态分布独立随机变量具有良好的性质若X与Y独立,则EXY=EX·EY,VarX+Y=VarX+VarY这些性质在统计推断和随机过程分析中有广泛应用二维正态分布定义主要性质独立性与相关性线性变换ₓₓᵧᵧ二维随机变量X,Y服从二维正态分布,
1.边缘分布X~Nμ,σ²,Y~Nμ,σX与Y独立当且仅当ρ=0对二维正态分二维正态随机变量的任意线性组合其联合概率密度函数具有特定形式,包²布,不相关等价于独立,这是正态分布aX+bY+c仍服从一维正态分布,这一性ₓᵧₓᵧ含五个参数μ,μ均值,σ,σ标准的特殊性质质在多元统计分析中非常重要
2.条件分布Y=y条件下,X~差和ρ相关系数ₓₓᵧᵧₓNμ+ρσy-μ/σ,1-ρ²σ²二维正态分布是多元正态分布的特例,在统计模型中有广泛应用其等高线为椭圆,椭圆的主轴方向由相关系数ρ决定当ρ=0时,椭圆主轴平行于坐标轴;当ρ≠0时,椭圆主轴倾斜二维正态分布是建模两个相关随机变量的有力工具,例如身高与体重、考试成绩间的关系、金融资产的联合收益等通过估计分布参数,可以预测一个变量给定另一个变量取值时的行为第四部分随机变量的数字特征期望随机变量的平均值,反映了随机变量取值的集中趋势,是描述随机变量最基本的特征方差与标准差衡量随机变量取值分散程度的指标,方差越大表示随机变量取值波动越大,分布越分散协方差与相关系数描述两个随机变量之间线性相关性的指标,用于衡量两个变量共同变化的程度与方向矩与矩母函数更全面描述随机变量分布特征的工具,高阶矩反映了分布的偏斜度、峰度等性质随机变量的数字特征是概率分布的重要特性,它们以集中的方式反映了随机变量的整体统计特性虽然这些特征量无法完全确定随机变量的分布,但在实际应用中常常能提供足够的信息帮助我们理解随机现象并进行决策期望期望的定义期望的性质随机变量X的数学期望(或均值)EX是X所有可能取值的加权
1.线性性质EaX+bY=aEX+bEY,其中a、b为常数这平均,权重为相应的概率期望描述了随机变量取值的平均水一性质对任意随机变量X、Y成立,不要求它们独立平或中心位置,是最基本的集中趋势度量
2.独立性质若X与Y独立,则EXY=EXEY这一性质是独ᵢᵢ形式上,离散型随机变量X的期望为EX=∑xPX=x,其中立随机变量的重要特征,但对不独立的随机变量一般不成立求和遍及X的所有可能取值;连续型随机变量X的期望为EX=∫xfxdx,其中积分区间为X的全部取值范围
3.常数性质若X为常数c,则EX=c期望的整体移动性质EX+c=EX+c;整体伸缩性质EcX=cEX需要注意的是,期望不一定是随机变量的可能取值例如,掷骰子的期望是
3.5,但骰子不可能出现
3.5点此外,某些随机变量的期望可能不存在,如柯西分布期望在各领域有广泛应用在金融中代表投资的平均收益;在保险中用于计算公平保费;在统计推断中,样本均值是总体均值的估计量;在决策理论中,期望值决策是常用的决策准则方差方差的定义随机变量X的方差VarX(或记为DX、σ²)定义为X与其期望值偏离的平方的期望VarX=E[X-EX²]方差度量了随机变量取值的分散程度或波动性,是最基本的离散程度度量方差的计算方差可以通过展开计算公式得到VarX=EX²-[EX]²这一计算公式通常比定义公式更为方便,特别是在计算离散型随机变量的方差时标准差标准差σ定义为方差的算术平方根σ=√VarX标准差与原随机变量具有相同的量纲,更易于解释例如,若身高的标准差为5厘米,表明个体身高通常偏离均值约5厘米方差的性质
1.非负性VarX≥0,当且仅当X为常数时取等号
2.常数性质若X为常数c,则VarX=
03.整体移动性质VarX+c=VarX,即常数的加入不改变分散程度
4.尺度变换性质VaraX=a²VarX
5.若X与Y独立,则VarX+Y=VarX+VarY协方差与相关系数协方差的定义相关系数的定义随机变量X与Y的协方差定义为CovX,Y相关系数ρ是标准化的协方差ρ=1ₓᵧ=E[X-EXY-EY],衡量两个随机变量CovX,Y/σσ,取值范围[-1,1]|ρ|越2线性相关程度计算公式CovX,Y=接近1表示线性相关性越强,ρ=0表示X与EXY-EXEY Y不相关协方差的性质独立性与不相关性
1.对称性CovX,Y=CovY,X4若X与Y独立,则它们一定不相关
32.自协方差CovX,X=VarXCovX,Y=0反之不成立不相关不一定
3.线性性质CovaX+b,cY+d=独立,除非X,Y服从二维正态分布acCovX,Y协方差和相关系数在数据分析、金融投资和机器学习等领域有广泛应用它们帮助我们量化变量间的线性关系强度和方向,是构建多变量模型的基础需要注意的是,相关关系不等同于因果关系即使两个变量高度相关,也不能直接推断它们之间存在因果联系此外,相关系数只能捕捉线性关系,对于非线性关系需要使用其他技术矩与矩母函数矩的类型定义含义ᵏk阶原点矩EX随机变量的k次方的期望ᵏk阶中心矩E[X-EX]随机变量与其期望的偏差的k次方的期望ᵗˣ矩母函数Mt=Ee生成所有阶原点矩的函数原点矩与中心矩是描述随机变量分布特征的重要工具一阶原点矩是期望;二阶中心矩是方差;三阶中心矩与偏度有关,描述分布的不对称性;四阶中心矩与峰度有关,描述分布尾部的厚度矩母函数是一个强大的工具,它不仅可以生成所有阶原点矩,还能唯一确定随机变量的分布(若矩母函数存在)对于矩母函数Mt,有原点矩的生成ᵏᵏ第k阶原点矩EX可通过矩母函数在t=0处的k阶导数获得EX=M^k0唯一性如果两个随机变量具有相同的矩母函数,则它们具有相同的概率分布线性变换ᵧₓ若Y=aX+b,则M t=e^btM at独立随机变量的和ₓᵧ若X与Y独立,则MX+Yt=M t·M t切比雪夫不等式定理内容定理意义切比雪夫不等式给出了随机变量偏离其期望值的概率上界对于任意随切比雪夫不等式提供了随机变量取值集中在期望附近的定量描述,表明机变量X,若其期望EX和方差VarX存在,则对任意正数ε,有无论随机变量的具体分布如何,其取值偏离期望的概率都受到方差控制这是大数定律的理论基础P|X-EX|≥ε≤VarX/ε²例如,取k=2,得到P|X-EX|≥2σ≤1/4,即任何随机变量偏离期望或等价地,对任意正数k,有值两个或更多标准差的概率不超过25%;取k=3,得到P|X-EX|≥3σ≤1/9≈
11.1%P|X-EX|≥kσ≤1/k²其中σ=√VarX是标准差切比雪夫不等式的应用
1.提供了随机变量与其期望偏离程度的概率上界,适用于任何分布
2.是大数定律证明的关键工具
3.在样本均值估计总体均值时,可用于构造置信区间需要注意的是,切比雪夫不等式给出的是上界,实际偏离概率通常远小于这个上界对于特定分布(如正态分布),有更精确的不等式可用第五部分大数定律与中心极限定理大数定律中心极限定理大数定律阐述了大量重复试验中,随机事件的频率趋于稳定,中心极限定理说明,无论原始总体分布如何,大量独立同分布接近其概率的现象它是概率论的基本定律,为统计学提供了随机变量之和的分布近似服从正态分布这一定理解释了正态理论基础分布在自然和社会现象中的普遍存在形式上,大数定律表明,随机变量序列的算术平均值随样本量中心极限定理是统计推断的理论基础,它使我们能够基于样本增大而以概率1收敛于期望值这解释了为什么在长期赌博中对总体参数进行估计和假设检验无论研究的是学生成绩、产,赌场几乎总能获胜,因为大数定律保证了结果将接近理论期品质量还是测量误差,中心极限定理都提供了建模的数学基础望这两个定理共同构成了概率论与数理统计的核心,连接了理论概率模型与实际统计数据大数定律说明了样本均值是总体期望的一致估计量;中心极限定理进一步描述了这种收敛的速度和模式掌握这两个定理对于理解统计方法的原理和局限性至关重要大数定律切比雪夫大数定律₁₂ₙ设X,X,...,X,...是一列相互独立的随机变量序列,它们具有相同的期望μ和有限方差σ²则对任₁₂ₙₙₙ意ε0,有P|X̄-μ|ε→1n→∞,其中X̄=X+X+...+X/n是前n个随机变量的算术平均值伯努利大数定律ₐ设n是n次独立重复试验中事件A发生的次数,p是每次试验中A发生的概率,则对任意ε0,有ₐₐP|n/n-p|ε→1n→∞这表明,随着试验次数增加,事件A发生的频率n/n几乎必然接近其概率p辛钦大数定律₁₂₁ₙₙ设X,X,...,X,...是一列相互独立同分布的随机变量序列,若EX=μ存在,则当n→∞时,X̄依概率收敛于μ与切比雪夫大数定律相比,辛钦定律放宽了方差有限的要求,仅需期望存在强大数定律在适当条件下,随机变量序列的算术平均值不仅依概率收敛于期望值,而且几乎必然收敛即ₙₙPlim→∞X̄=μ=1,表明对几乎所有样本序列,样本均值最终会收敛到期望值大数定律是概率论最基本的定律之一,它说明了随机现象在大量重复观察下表现出的统计规律性这一定律解释了为什么概率可以用频率来估计,为统计方法提供了理论基础中心极限定理独立同分布的中心极限定理₁₂₁₂ₙₙₙₙₙ设X,X,...,X,...是独立同分布的随机变量序列,具有相同的期望μ和方差σ²0定义S=X+X+...+X,则当n充分大时,随机变量Z=S-nμ/σ√n的分布近似于标准正态分布N0,1定理De Moivre-Laplace设X~Bn,p为n次伯努利试验中成功的次数,则当n充分大时,X-np/√np1-p近似服从标准正态分布N0,1这是中心极限定理在二项分布上的特例李雅普诺夫定理中心极限定理的一个更一般形式它放宽了独立同分布的要求,仅要求随机变量序列满足一定的条件(李雅普诺夫条件),就能证明其标准化和的分布渐近于正态分布实际应用中心极限定理广泛应用于统计推断、质量控制、风险管理等领域例如,在抽样调查中,样本均值约服从正态分布,这为构造置信区间和进行假设检验提供了理论基础大数定律与中心极限定理的应用统计推断基础实际问题中的应用应用注意事项大数定律保证了样本统计量(如样本均值、样这两个定理解释了许多实际现象为什么测量应用中心极限定理需要注意样本量的要求当本比例)是总体参数的一致估计量中心极限误差经常表现为正态分布;为什么大样本调查原始数据近似正态分布时,小样本也适用;当定理进一步指明了这些估计量的抽样分布,为比小样本调查更准确;为什么赌场长期盈利几原始数据严重偏斜时,需要较大样本(通常区间估计和假设检验提供了理论基础乎是必然的n≥30)才能保证近似效果在金融领域,投资组合理论利用中心极限定理大数定律只描述了长期趋势,不能预测短期结例如,在构造均值的置信区间时,我们利用中减少风险;在质量控制中,过程能力分析依赖果例如,虽然抛硬币正面朝上的频率最终会心极限定理知道样本均值近似服从正态分布,于中心极限定理判断生产过程稳定性;在保险接近
0.5,但在有限次试验中可能出现显著偏从而可以使用正态分布的性质计算置信界限精算中,大数定律帮助确定合理保费离第六部分数理统计基础抽样分布统计量参数估计统计量的概率分布了解抽样分布是进行统计推断的关样本的函数,如样本均值、基于样本数据估计总体参数键,如t分布、χ²分布和F分样本方差、样本中位数等的方法,包括点估计和区间布假设检验统计量是连接样本与总体的估计常用的估计方法有矩总体与样本桥梁,是统计推断的工具估计法和最大似然估计法用样本信息判断关于总体的总体是研究对象的全体,样假设是否成立统计检验包本是从总体中抽取的部分个括参数检验和非参数检验,体统计推断的目的是通过涉及显著性水平、p值等概样本信息推断总体特征念2总体与样本总体与样本的概念抽样方法总体Population是研究对象的全体,包含所有可能的观测值,通简单随机抽样每个个体被抽到的概率相等,是最基本的抽样方法常用大写字母X表示,具有概率分布Fx;θ,其中θ是待估参数实现方式包括随机数表法、随机数生成器等₁样本Sample是从总体中按某种规则抽取的部分个体,记为X,分层抽样将总体分为互不重叠的层,在每层内进行简单随机抽样₂ₙX,...,X在基本抽样模型中,样本是从总体中独立抽取的随机当各层内部同质性高、层间差异明显时,分层抽样比简单随机抽变量,且具有与总体相同的分布样更有效系统抽样按固定间隔从排列好的总体中抽取样本,如每隔10个抽取一个操作简便,但当总体有周期性变化时可能产生偏差整群抽样将总体分为若干群,随机抽取完整的群作为样本适用于总体地理分布广的情况,但精度通常低于简单随机抽样良好的抽样设计是统计推断的基础在实际研究中,样本的代表性直接影响到统计分析结果的可靠性随机抽样消除了主观偏见,保证了样本的代表性和统计方法的有效性常用统计量样本均值ᵢ₌₁ⁿᵢ样本均值X̄=1/n∑X是总体均值μ的无偏估计量当样本量足够大时,根据中心极限定理,X̄近似服从正态分布Nμ,σ²/n,其中σ²是总体方差样本方差ᵢ₌₁ⁿᵢ样本方差S²=1/n-1∑X-X̄²是总体方差σ²的无偏估计量为消除偏差,分母使用n-1而非n样本标准差S是样本方差的平方根,用于估计总体标准差σ样本中位数将样本数据按大小排序后居中的值若样本量n为奇数,中位数为第n+1/2个观测值;若n为偶数,中位数为第n/2和第n/2+1个观测值的平均中位数不受极端值影响,是位置的稳健估计量样本矩̂ᵢ₌₁ⁿᵢᵏₖk阶样本原点矩m=1/n∑X是总体k阶原点矩的估计;k阶样本中心矩̂ᵢ₌₁ⁿᵢᵏₖM=1/n∑X-X̄是总体k阶中心矩的估计高阶矩常用于描述分布的偏度、峰度等特征这些统计量是数据分析的基本工具,用于描述样本特征和估计总体参数在选择适当的统计量时,应考虑数据类型、分布特征和研究目的例如,对于高度偏斜的数据,中位数可能比均值更能代表中心趋势抽样分布分布χ²₁₂₁₂ₙₙ若X,X,...,X是来自标准正态总体N0,1的独立样本,则统计量χ²=X²+X²+...+X²服从自由度为n的χ²分布,记为χ²~χ²nχ²分布的期望为n,方差为2n当n较大时,χ²分布近似于正态分布Nn,2n分布t若X~N0,1,Y~χ²n,且X与Y独立,则T=X/√Y/n服从自由度为n的t分布,记为T~tnt分布是对称的钟形曲线,当n→∞时,t分布趋近于标准正态分布t分布常用于小样本情况下的区间估计和假设检验分布F₁₂₁₂₁₂₁₂若U~χ²n,V~χ²n,且U与V独立,则F=U/n÷V/n服从自由度为n,n的F分布,记为F~Fn,n F分布是非对称的,右偏,常用于方差分析和回归分析中的显著性检验这些分布在统计推断中起着关键作用
1.χ²分布用于总体方差的区间估计、拟合优度检验、独立性检验等
2.t分布用于正态总体均值的区间估计和假设检验,特别是在总体标准差未知且样本容量较小的情况
3.F分布用于两个正态总体方差比的检验、方差分析中组间方差与组内方差比的检验等这些分布之间存在密切关系t²n~F1,n;Fn,∞~χ²n/n了解这些关系有助于理解不同统计检验方法之间的联系参数估计点估计区间估计点估计是用样本统计量估计总体参数的具体数值例如,用样区间估计是构造一个区间,使得总体参数以给定的置信水平落̂本均值X̄估计总体均值μ,用样本比例p估计总体比例p在这个区间内常见的置信水平有90%、95%和99%̂̂̂评价点估计的标准包括无偏性(estimator的期望等于被估置信区间的一般形式为[θ-δ,θ+δ],其中θ是参数θ的点估计,δ参数)、有效性(在无偏estimator中方差最小)、一致性(与estimator的抽样分布、样本量和置信水平有关置信区间样本量增大时estimator依概率收敛于参数)和充分性(反映了估计的精确度区间越窄,估计越精确extracting所有样本信息)常用的参数估计方法包括矩估计法和最大似然估计法矩估计法基于样本矩等于相应总体矩的思想,操作简便但效率较低最大似然估计法寻找使观测数据出现概率最大的参数值,通常具有良好的大样本性质在实际应用中,点估计提供了参数的最佳猜测,而区间估计考虑了估计的不确定性,提供了更全面的信息随着样本量增加,点估计更准确,区间估计更精确(区间变窄)矩估计法原理矩估计法的基本思想是用样本矩估计相应的总体矩,然后根据总体矩与待估参数之间的关系,求解参数的估计值具体来说,令样本k阶矩等于相应的总体k阶矩,建立方程组求解未知参数步骤₁₂
1.确定需要估计的参数θ,θ,...,θₖᵏ
2.建立总体矩EX,EX²,...,EX与参数之间的关系̂₁ᵢ₌₁ⁿᵢ̂₂ᵢ₌₁ⁿᵢ̂ᵢ₌₁ⁿᵢᵏ
3.计算样本矩m=1/n∑X,m=1/n∑X²,...,mₖ=1/n∑X̂ⱼʲ
4.建立矩方程m=EX,j=1,2,...,k̂₁̂₂̂
5.解方程组得到参数估计值θ,θ,...,θₖ示例̂对于正态分布Nμ,σ²,总体一阶矩EX=μ,二阶中心矩E[X-μ²]=σ²令样本一阶矩等于总体一阶矩,得μ=X̄;令样本̂ᵢ₌₁ⁿᵢ二阶中心矩等于总体二阶中心矩,得σ²=1/n∑X-X̄²矩估计法的优缺点优点计算简单,适用范围广(即使总体分布未知,也可能得到参数的合理估计),对于简单情况,其估计量可能与最大似然估计量相同缺点统计效率较低,对大样本更有效;高阶矩的估计不稳定,受极端值影响大;可能得到参数的不合理估计(如方差为负)最大似然估计法基本原理1最大似然估计MLE的核心思想是选择使观测数据出现概率最大的参数值作为估计值直观上,我们认为实际观测到的样本是最有可能出现的,因此选择能最大化这种可能性的参数值似然函数₁₂2给定样本X,X,...,Xₙ和参数θ,似然函数Lθ定义为样本观测值的联合概率(密度)函数,视为θ的函数对于离散型随机变量,₁₁₂₂₁₂Lθ=PX=x,X=x,...,Xₙ=xₙ;θ;对于连续型随机变量,Lθ=fx,x,...,xₙ;θ基本步骤ᵢ₌₁ⁿᵢ
1.构建似然函数Lθ在独立同分布的情况下,Lθ=∏fx;θ
2.通常为计算方便,取对数得到对数似然函数ln Lθ
3.求导数dln Lθ/dθ并令其等于0,得到似然方程̂
4.解似然方程,求得最大似然估计值θ
5.验证二阶导数为负,确保是极大值点最大似然估计具有许多优良性质
1.一致性在一般条件下,当样本量增大时,MLE收敛于真参数值
2.渐近正态性大样本下,MLE近似服从以真参数为均值的正态分布
3.渐近有效性大样本下,MLE的方差达到Cramér-Rao下界,即渐近有效̂̂
4.不变性若θ是参数θ的MLE,则gθ是gθ的MLE,其中g是单调函数最大似然估计在统计推断中广泛应用,是现代统计学的基石之一虽然计算上可能比矩估计复杂,但其优良的统计性质使其成为参数估计的首选方法区间估计置信区间的概念正态总体均值的置信区间置信区间是包含总体参数真值的一个区间估计,与之相
1.已知总体标准差σμ的1001-α%置信区间为[X̄-关的置信水平1-α表示在重复抽样中,有1001-α%的置zα/2·σ/√n,X̄+zα/2·σ/√n],其中zα/2是标准正态分信区间包含参数真值例如,95%置信区间意味着在长布的上侧α/2分位数期重复抽样中,约95%的区间包含真参数值
2.未知总体标准差σμ的1001-α%置信区间为[X̄-̂̂̂置信区间的一般形式为[θ-δ,θ+δ],其中θ是参数估计值tα/2n-1·S/√n,X̄+tα/2n-1·S/√n],其中tα/2n-1,δ取决于置信水平和estimator的抽样分布是自由度为n-1的t分布的上侧α/2分位数正态总体方差的置信区间总体比例的置信区间正态总体方差σ²的1001-α%置信区间为[n-对于二项总体比例p,当样本量较大时,p的1001-α%̂̂̂̂̂1S²/χ²α/2n-1,n-1S²/χ²1-α/2n-1],其中χ²α/2n-1置信区间为[p-zα/2·√p1-p/n,p+zα/2·√p1-̂̂和χ²1-α/2n-1分别是自由度为n-1的χ²分布的上侧α/2和p/n],其中p是样本比例1-α/2分位数假设检验基本步骤₀₁
1.提出原假设H和备择假设H原假设通常是无差异或无效果的陈述,备择假设是研究者希望证明的陈述₀
2.选择检验统计量和确定其在H成立时的抽样分布
3.指定显著性水平α,确定拒绝域₀
4.计算检验统计量的值,与临界值比较,决定是否拒绝H
5.做出统计结论和实际解释错误类型₀第一类错误(α错误)H实际为真但被拒绝的概率,等于显著性水平α₀₁第二类错误(β错误)H实际为假但未被拒绝的概率检验的功效Power=1-β是当H为真时₀正确拒绝H的概率这两类错误之间存在权衡关系在样本量固定的情况下,降低一类错误的概率会增加另一类错误的概率值方法P₀P值是在原假设H成立的条件下,观测到的统计量或更极端值出现的概率P值越小,证据越强₀烈地反对H₀₀检验决策规则如果P值≤α,则拒绝H;如果P值α,则不拒绝H₀₀P值不是H为真的概率,而是量化证据强度的指标P值小表明样本结果在H下不太可能出现,但这不一定意味着效应很大或有实际意义正态总体均值的假设检验单个总体两个总体₁₁₂₂₁₂对正态总体Nμ,σ²均值μ的假设检验,通常考虑三种情形对两个独立正态总体Nμ,σ²和Nμ,σ²均值差μ-μ₀₀₁₀的检验,假设通常为
1.双侧检验H:μ=μvs H:μ≠μ₀₁₂₁₁₂₁₂₁₂₀₀₁₀H:μ=μvs H:μ≠μ(或μμ或μμ)
2.左侧检验H:μ≥μvs H:μμ₁₂₁₂₀₀₁₀当σ²和σ²已知时,检验统计量Z=X̄-X̄-₀₁₁₂₂₀
3.右侧检验H:μ≤μvs H:μμd/√σ²/n+σ²/n~N0,1,其中d是假设的均值₀差(通常为0)当总体标准差σ已知时,检验统计量Z=X̄-μ/σ/√n~₀₁₂N0,1;当σ未知时,统计量t=X̄-μ/S/√n~tn-1当σ²=σ²=σ²但未知时,先用两个样本方差的加权平均₁₁₂₂₁₂ₚS²=[n-1S²+n-1S²]/n+n-2估计σ²,然后检₁₂₀₁₂₁₂ₚ验统计量t=X̄-X̄-d/√S²1/n+1/n~tn+n-2均值检验是最常用的参数检验之一,广泛应用于质量控制、医学研究、心理学实验等领域例如,检验新药是否比安慰剂更有效;测试新工艺是否改善了产品质量;评估不同教学方法对学生成绩的影响等正态总体方差的假设检验检验类型假设检验统计量拒绝域显著性水平α₀₀₁₀₀₁₋₂₂单个总体方差H:σ²=σ²vs H:σ²≠σ²χ²=n-1S²/σ²~χ²n-1χ²χ²α/n-1或χ²χ²α/n-1₀₁₂₁₁₂₁₂₁₂₂₁₂两个总体方差比H:σ²=σ²vs H:σ²≠σ²F=S²/S²~Fn-1,n-1FFα/n-1,n-1正态总体方差的检验在质量控制、可靠性分析和实验设计中有重要应用方差检验通常对总体分布的正态性假设较为敏感,当这一假设不成立时,检验结果可能不可靠单个总体方差检验用于评估过程稳定性,如生产过程的波动是否超过允许范围两个总体方差比的检验可用于比较两种测量方法的精度、两种工艺的稳定性等在实际应用中,方差检验往往是其他统计分析的前提例如,两个总体均值差异的t检验需要先检验两个总体方差是否相等,以决定使用等方差还是不等方差的t检验公式第七部分回归分析线性回归模型回归分析基本概念线性回归假设因变量与自变量之间存在回归分析是研究变量之间关系的统计方线性关系一元线性回归只有一个自变法,特别是探索一个因变量Y与一个或₀₁量Y=β+βX+ε;多元线性回归有多个自变量X之间的函数关系它是预多个自变量测和因果分析的重要工具₀₁₁ₚₚY=β+βX+...+βX+ε模型评估参数估计通过决定系数R²、F检验和残差分析评4最小二乘法是估计回归参数的标准方法估模型的拟合优度和有效性R²表示模,其目标是最小化残差平方和对于一型解释的因变量变异比例;F检验评估₁₀元线性回归,可直接计算β和β的整体模型显著性;残差分析检查模型假估计值设回归分析在经济学、生物学、社会科学和工程领域有广泛应用它可用于预测股票价格、分析销售与广告支出的关系、研究药物剂量与疗效的关联等随着计算机技术的发展,回归分析已成为数据科学和机器学习的基础工具一元线性回归模型假设₀₁₀₁一元线性回归模型假设因变量Y与自变量X之间存在线性关系Y=β+βX+ε,其中β是截距,β是斜率,ε是随机误差项模型的基本假设包括
1.线性关系Y与X之间是线性关系
2.误差项ε具有零均值Eε=
03.同方差性Varε=σ²(常数)
4.误差项相互独立
5.误差项服从正态分布(用于推断,但不影响参数估计)参数估计ᵢŶᵢ最小二乘法通过最小化残差平方和∑Y-²确定参数估计值对于一元线性回归,参数估计公式为̂₁ᵢᵢȲᵢβ=∑X-X̄Y-/∑X-X̄²̂₀Ȳ̂₁β=-βX̄Ŷ̂₀̂₁Ŷ回归直线方程为=β+βX,其中是Y的预测值统计推断̂ᵢŶᵢ估计误差方差σ²=∑Y-²/n-2̂₁̂₁̂ᵢβ的标准误sβ=σ/√∑X-X̄²̂₀̂₀̂ᵢβ的标准误sβ=σ√1/n+X̄²/∑X-X̄²在正态假设下,可构造参数的置信区间和进行假设检验模型评价ᵢȲŶᵢȲ决定系数R²=SSR/SST=1-SSE/SST表示模型解释的因变量变异比例,其中SST=∑Y-²(总变异),SSR=∑-²(回ᵢŶᵢ归解释的变异),SSE=∑Y-²(残差变异)R²取值在0到1之间,越接近1表示模型拟合越好回归方程的显著性检验检验整体模型显著性检验回归系数显著性F tF检验用于评估回归模型作为整体是否显著,即检验自变量是否对因t检验用于评估单个回归系数的显著性,即检验各自变量对因变量的₁变量有显著影响对于一元线性回归,假设为影响是否显著对于回归系数β,假设为₀₁₀₁H:β=0(自变量X对Y无显著影响)H:β=0(自变量X对Y无显著影响)₁₁₁₁H:β≠0(自变量X对Y有显著影响)H:β≠0(自变量X对Y有显著影响)̂₁̂₁̂₁̂₁检验统计量为F=MSR/MSE,其中MSR=SSR/1(回归均方),检验统计量为t=β/sβ,其中sβ是β的标准误MSE=SSE/n-2(误差均方)₀在H成立且误差项正态的条件下,t~tn-2若|t|tα/2;n-2,则₀₀在H成立的条件下,F~F1,n-2若计算的F值大于给定显著性水拒绝H,表明回归系数显著不为零₀平α下的临界值Fα;1,n-2,则拒绝H,表明回归模型显著有效对于一元线性回归,F检验和t检验的结果是等价的,即F=t²但在多元回归中,F检验评估整体模型的显著性,而t检验评估各个自变量的显著性,因此二者提供互补信息在实际应用中,通过计算机软件可以得到回归系数的P值若P值小于给定的显著性水平α(通常为
0.05),则认为相应的自变量对因变量有显著影响多元线性回归模型建立参数估计方法多元线性回归模型考虑多个自变量对因变量多元回归参数通常用矩阵形式的最小二乘法̂⁻的影响估计β=XX¹XY,其中X是n×p+1的₀₁₁₂₂̂ₚₚY=β+βX+βX+...+βX+ε,其中设计矩阵,Y是n×1的因变量向量,β是₁₂ₚX,X,...,X是p个自变量,p+1×1的参数估计向量₀₁ₚβ,β,...,β是待估计的参数,ε是随机误模型假设与一元线性回归类似线性关系、与一元回归类似,可计算参数估计的标准误差项误差项零均值、同方差性、独立性和正态性、置信区间和预测区间决定系数R²和调整此外,多元回归还要考虑自变量间的多重后的R²adj=1-1-R²n-1/n-p-1用于评价模共线性问题型拟合优度变量选择在多元回归中,不是所有自变量都对模型有显著贡献变量选择方法帮助确定最佳自变量集合,常用的方法包括
1.逐步回归根据统计显著性逐个增加或删除变量
2.前向选择从无变量开始,逐个添加最显著的变量
3.后向消除从全模型开始,逐个删除最不显著的变量
4.信息准则如AICAkaike信息准则和BIC贝叶斯信息准则第八部分方差分析方差分析的基本思想检验原理方差分析的类型方差分析ANOVA是比较方差分析的基本假设是各单因素方差分析只考虑一多个总体均值是否相等的组内的观测值服从正态分个因素(自变量)的影响统计方法,通过分析不同布且具有相同的方差检;双因素方差分析考虑两来源的变异来判断组间差验假设为个因素的主效应及其交互₀₁₂ₖ异是否显著它将总变异H:μ=μ=...=μvs作用;多因素方差分析考₁分解为组间变异(处理效H:至少有两个均值不相虑多个因素的影响根据应导致的变异)和组内变等若组间变异显著大于实验设计,还有完全随机异(随机误差导致的变异组内变异,则认为各组均设计、随机区组设计和拉)值不全相等丁方设计等变体应用场景方差分析广泛应用于心理学、医学、农业和工业研究中,用于比较不同处理、方法或条件下的效果差异例如,比较不同肥料对作物产量的影响、不同教学方法对学生成绩的影响、不同药物剂量对患者恢复的影响等单因素方差分析实例分析检验F平方和分解研究三种教学方法对学生成绩的影响₀₁₂原理与步骤ₖ检验假设H:μ=μ=...=μ(各水平从每种方法下随机选取若干学生进行测ᵢⱼȲ总平方和SST=∑∑Y-..²分解为组间无差异)F统计量为F=MSA/MSE,试,记录成绩通过方差分析比较三种ᵢȲᵢȲ单因素方差分析考察一个因素(自变量间平方和SSA=∑n.-..²和组内平方其中MSA=SSA/k-1是组间均方,方法的平均成绩是否存在显著差异若FᵢⱼȲᵢȲᵢᵢ)对因变量的影响假设有k个水平的因和SSE=∑∑Y-.²,其中.是第i组MSE=SSE/n-k是组内均方,n=∑n是检验显著,则至少有两种方法的效果不ᵢȲ₀素,每个水平下有n个观测值模型假的均值,..是总均值总样本量在H成立下,F~Fk-1,n-同ᵢⱼᵢᵢⱼ设为Y=μ+α+ε,其中μ是总均值,kᵢᵢⱼα是第i个水平的效应,ε是随机误差当F检验显著时,通常需要进行多重比较以确定具体哪些组之间存在差异常用的方法有LSD法、Tukey法、Scheffé法和Bonferroni法等这些方法在控制总体错误率的同时比较各组均值的差异双因素方差分析交互作用两个因素的效应可能不仅仅是相加关系,某一因素的效应可能依赖于另一因素的水平主效应2各因素单独对因变量的影响,忽略其他因素的存在双因素方差分析模型考虑两个因素A和B对因变量Y的影响,包括两个因素的主效应及其交互作用ᵢⱼᵢⱼᵢⱼᵢⱼᵢⱼᵢⱼᵢⱼₖₖₖ双因素方差分析模型可表示为Y=μ+α+β+αβ+ε,其中μ是总均值,α是因素A第i水平的效应,β是因素B第j水平的效应,αβ是交互效应,ε是随机误差双因素方差分析有两种设计无重复实验和有重复实验无重复实验每个处理组合只有一个观测值,无法估计交互效应;有重复实验每个处理组合有多个观测值,可以估计和检验交互效应在有重复实验中,总变异分解为因素A的变异、因素B的变异、交互作用的变异和随机误差的变异通过F检验分别检验两个主效应和交互效应是否显著若交互效应显著,则应先解释交互作用,再考虑主效应;若交互效应不显著,可直接解释主效应总结与展望课程要点回顾实际应用价值本课程系统地讲解了概率论与数理统计的基概率与统计方法在现代科学研究、工程技术本理论和方法,涵盖了概率论基础、随机变、经济金融、医学生物和社会科学等领域有量及其分布、多维随机变量、随机变量的数着广泛的应用它们为不确定性环境下的决字特征、大数定律与中心极限定理、数理统策提供了科学工具,为数据分析和预测建模计基础、回归分析和方差分析等内容这些提供了理论基础,为科学研究的设计和分析知识构成了概率统计学科的核心体系提供了方法论指导进一步学习建议对于有兴趣深入学习的同学,推荐进一步学习随机过程、贝叶斯统计、多元统计分析、时间序列分析、非参数统计和机器学习等高级内容此外,掌握统计软件(如R、Python、SPSS、SAS等)的实际应用能力,将理论知识与实际问题结合,是提高概率统计应用水平的关键概率论与数理统计是一门理论深刻而应用广泛的学科,它不仅是数学的重要分支,也是数据科学和人工智能的理论基础随着大数据时代的到来,概率统计方法在数据挖掘、模式识别、自然语言处理等前沿领域发挥着越来越重要的作用本课程的学习只是一个开始,希望同学们能将所学知识灵活应用于实际问题,并在实践中不断深化对概率统计思想的理解概率统计思维是现代科学素养的重要组成部分,掌握这种思维方式将使你受益终身。
个人认证
优秀文档
获得点赞 0