还剩48页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
高中概率论教学课件本课件系统地讲解高中概率论核心内容,严格按照新课标要求编排,同时适用于自主招生考试备考通过理论与实践相结合的方式,帮助学生建立概率思维,掌握统计方法概率论与统计的简介概率论的重要性概率论是研究随机现象规律的数学分支,它帮助我们理解不确定性,为决策提供科学依据在现代社会中,概率论已经渗透到科学研究、工程技术、金融保险、医疗健康等众多领域从天气预报到疾病诊断,从股票投资到质量控制,概率统计方法无处不在,是现代科学技术的重要基础学习目标与课程结构教学目标掌握概率的基本概念与计算方法•理解随机变量及其分布特性•学会应用概率模型解决实际问题•培养概率思维与统计意识•课程结构随机事件与概率基础(第讲)•1-15随机变量与分布(第讲)•16-27数字特征与极限定理(第讲)•28-36统计推断与应用(第讲)•37-50什么是随机事件随机事件是在随机试验中可能发生也可能不发生的事件,其结果具有不确定性基本类型确定事件必然发生的事件,概率为1不可能事件不可能发生的事件,概率为0随机事件可能发生也可能不发生的事件典型例子抛硬币得到正面、掷骰子得到点、从袋中抽到红球等都是随6机事件事件的基本运算与运算()或运算(∪)∩事件与事件同时发生事件或事件至少有一个发生A B A B例掷骰子时,既是偶数又小于的例掷骰子时,是偶数或小于的点44点数数={2}={1,2,3,4,6}非运算()¯事件不发生A例掷骰子时,不是偶数的点数={1,3,5}文氏图是表示事件关系的有效工具,通过图形直观展示事件间的逻辑关系样本空间与基本事件核心概念样本点随机试验中的每个可能结果样本空间所有可能结果的集合,记为Ω基本事件只含一个样本点的事件典型样本空间示例掷一枚骰子Ω={1,2,3,4,5,6}抛两枚硬币正正正反反正反反Ω={,,,,,,,}频率与概率的区别频率定义概率定义在次重复试验中,事件发生的次数与试随机事件发生的可能性大小,是理论值n Am验总次数的比值n f_nA=m/n当试验次数趋于无穷大时,频率的n f_nA频率是统计值,会随试验次数变化稳定值就是概率PA古典概型定义与特点古典概型是指试验满足两个条件的概率模型样本空间中只有有限个样本点
1.每个基本事件发生的可能性相等(等可能性原理)
2.计算公式事件包含的基本事件数样本空间的基本事件总数PA=A/典型例子从中随机抽取一个数,求抽到偶数的概率1-10偶数P=5/10=1/2典型问题扑克牌概率黑桃牌概率抽到概率抽到的概率J,Q,K A从标准张扑克牌中随机抽张,抽到黑桃的概从标准张扑克牌中随机抽张,抽到中从标准张扑克牌中随机抽张,抽到的概率521521J,Q,K521A率为黑桃任一张的概率为为P=13/52=1/4PJ,Q,K=12/52=PA=4/52=1/133/13条件概率与乘法公式条件概率定义在事件已经发生的条件下,事件发生的概率,记为BAPA|B公式,其中PA|B=PA∩B/PB PB0乘法公式PA∩B=PB·PA|B=PA·PB|A实例说明从一个装有个红球和个白球的袋子中先后取出两个球(不放回),求53第二个球是红球的概率独立性与互斥性独立性(⊥)A B一个事件的发生不影响另一事件发生的概率数学表达PA∩B=PA·PBPA|B=PA互斥性(∅)A∩B=两个事件不能同时发生数学表达PA∩B=0如果且,则互斥事件必然不独立PA0PB0常见误区独立与互斥是不同的概念,互斥的事件(且时)一定不独立PA0PB0贝叶斯公式初步贝叶斯公式PA|B=[PB|A·PA]/PB=[PB|A·PA]/[PB|A·PA+PB|Ā·PĀ]思想精髓贝叶斯公式实现了从结果推原因的逆向思维,是概率论中的重要工具贝叶斯思想被广泛应用于医学诊断、机器学习、数据分析等领域,是现代统计学的重要基础概率加法公式互斥事件非互斥事件若∅,则一般情况A∩B=∪∪PA B=PA+PB PA B=PA+PB-PA∩B推广到三个事件∪∪PA BC=PA+PB+PC-PA∩B-PA∩C-PB∩C+PA∩B∩C概率乘法公式一般乘法公式PA∩B=PA·PB|A=PB·PA|B独立事件乘法公式若与相互独立,则A BPA∩B=PA·PB多事件推广PA∩B∩C=PA·PB|A·PC|A∩B习题与解答连续抛两次硬币,求至少有一次正面的概率至少一次正面两次都是反面P=1-P=1-1/2²=1-1/4=3/4典型案例生日悖论生日悖论问题在一个有人的班级中,至少有两人生日相同的概率是多少?40解法思路计算人生日都不相同的概率,再用减去这个概率401至少两人生日相同所有人生日不同P=1-P=1-365/365·364/365·363/365···326/365≈1-
0.109=
0.891生日悖论揭示了我们对概率的直觉往往不准确实际上,只需要人,23生日相同的概率就超过;人时已接近50%4090%随机变量定义离散型随机变量连续型随机变量取值只有有限个或可数无限多个,例如取值可以是某区间内的任意值,例如掷骰子的点数∈人的身高、体重•X{1,2,3,4,5,6}•家庭中孩子的数量某地区一天的降雨量••实验中成功的次数电子元件的寿命••随机变量是把随机试验的每个结果与一个数值对应起来的函数,将不确定性用数值化表示常见离散型分布介绍二项分布Bn,p次独立重复试验中,成功次数的分布n XPX=k=Cn,k·p^k·1-p^n-k,k=0,1,2,...,n例投篮次,每次命中率,至少命中次的概率
100.68泊松分布Pλ单位时间空间内随机事件发生次数的分布/PX=k=λ^k·e^-λ/k!,k=0,1,2,...例平均每小时收到封邮件,收到封邮件的概率23二项分布的性质二项分布特点Bn,p数学期望•EX=np方差•DX=np1-p当很大,很小,且时,二项分布近似服从泊松分布•n pnp=λPλ实例应用某班级考勤,每位同学缺席的概率为,班级有人,求恰好有人缺席
0.05503的概率解X~B50,
0.05PX=3=C50,3·
0.05³·
0.95^47≈C50,3·
0.05³·
0.95^47≈
0.185泊松分布应用解析客服接线交通事故产品质检某客服中心平均每分钟接到个电话,求某路段平均每天发生起交通事故,求连续某批产品平均每千件有个次品,从中抽查
105151.532500分钟内接到个电话的概率天无事故的概率件,求恰好发现个次品的概率61×××λ=515/10=
7.5λ=
1.53=
4.5λ=2500/1000=1PX=6=
7.5^6·e^-
7.5/6!≈
0.134PX=0=e^-
4.5≈
0.011PX=1=1·e^-1/1!=e^-1≈
0.368常见连续型分布介绍均匀分布正态分布Ua,b Nμ,σ²随机变量在区间上均匀分布的概率密度函数自然界中最常见的分布,其概率密度函数X[a,b]fx=1/b-a,a≤x≤b fx=1/σ√2π·e^-x-μ²/2σ²,-∞例随机数生成器产生区间的随机数例人类身高、学生成绩分布[0,1]正态分布及其曲线正态分布特点Nμ,σ²钟形曲线,关于对称•x=μ为分布的均值,决定曲线位置•μ为标准差,决定曲线的陡峭程度•σ时为标准正态分布•μ=0,σ=1N0,1原则3σ随机变量落在区间的概率约为Xμ-σ,μ+σ
68.3%落在区间的概率约为μ-2σ,μ+2σ
95.4%落在区间的概率约为μ-3σ,μ+3σ
99.7%正态分布广泛存在于自然和社会现象中,如人的身高、体重、智力测验成绩等都近似服从正态分布标准化与查表步骤一进行标准化对于,计算,则X~Nμ,σ²Z=X-μ/σZ~N0,1例将标准化为X~N100,25Z~N0,1步骤二使用标准正态分布表查表获取的值Φz=PZ≤z例查表得Φ
1.96=
0.975步骤三计算所需概率利用对称性和概率加法公式计算所需概率例PZ
1.96=1-Φ
1.96=
0.025分布函数与密度函数分布函数Fx定义Fx=PX≤x特点单调不减,,右连续0≤Fx≤1概率密度函数fx连续型随机变量的分布函数的导数Fxfx=FxPa≤X≤b=∫[a,b]fxdx分布函数表示随机变量不超过的概率,是累积概率;而密度函数表示X x随机变量落在某点附近的概率密度随机变量变换线性变换若,则X~Nμ,σ²Y=aX+b~Naμ+b,a²σ²例某测量,测量值的分布是?X~N10,4Y=2X+5解××Y~N210+5,2²4=N25,16和的分布若₁₁,₂₂且独立X~Nμ,σ²Y~Nμ,σ²X,Y则₁₂₁₂X+Y~Nμ+μ,σ²+σ²例,且独立,求的分布X~N5,9Y~N7,16X+Y解X+Y~N5+7,9+16=N12,25多维随机变量二维随机变量二维随机变量是指由两个随机变量和构成的随机向量X,Y X Y联合分布函数Fx,y=PX≤x,Y≤y离散型联合分布₁₁₁₁PX=x,Y=y=p连续型联合密度,且fx,y≥0∫∫fx,ydxdy=1二维随机变量可描述两个相互关联的随机现象,如人的身高和体重•商品的价格和销量•学生的数学和物理成绩•边缘分布与条件分布边缘分布离散型PX=x₁=∑ᵏPX=x₁,Y=yₖ连续型fₓx=∫fx,ydy条件分布离散型₁₁₁₁₁PX=x|Y=y=PX=x,Y=y/PY=y连续型fx|y=fx,y/fᵧy实例某高中男生的身高和体重联合分布,可计算在给定身高条件下体重的条件XY分布,或者不考虑体重的身高边缘分布随机变量的独立性(多维)随机变量独立的定义随机变量和相互独立,当且仅当X YFx,y=Fₓx·Fᵧy或fx,y=fₓx·fᵧy对于离散型随机变量₁₁₁₁PX=x,Y=y=PX=x·PY=y独立性的判断联合分布是否可以分解为边缘分布的乘积•一个变量的条件分布是否与另一变量的取值无关•典型误区相关系数为的随机变量不一定相互独立只有当服从二维正态分0X,Y布时,不相关才等价于独立协方差与相关系数协方差相关系数CovX,YρCovX,Y=E[X-EXY-EY]ρ=CovX,Y/[√DX·√DY]特点,表示完全线性=EXY-EX·EY-1≤ρ≤1|ρ|=1相关特点衡量两个随机变量的线性相关程度,值可正可负方差与协方差关系±±DX Y=DX+DY2CovX,Y若独立,则,即±X,Y CovX,Y=0DX Y=DX+DY常用数字特征数学期望EX离散型EX=∑ᵢxᵢPX=xᵢ连续型EX=∫xfxdx期望的性质•EaX+b=aEX+b•EX+Y=EX+EY若独立,则•X,Y EXY=EX·EY彩票期望计算实例某彩票售价元,中奖情况如下10方差与标准差方差标准差DXσDX=E[X-EX²]=EX²-[EX]²σ=√DX反映随机变量取值的波动程度与随机变量具有相同的量纲X X方差越大,取值越分散;方差越小,取值标准差常用于衡量数据的离散程度,在质越集中量控制、风险管理中广泛应用应用实例两个投资组合平均收益率相同,但风险(方差)不同时,通常选择方差小的投资组合某产品质量控制要求标准差不超过规定σ值,以保证产品质量稳定期望的性质与技巧期望的线性性质•EaX+bY=aEX+bEY•E∑ᵢaᵢXᵢ=∑ᵢaᵢEXᵢ分段计算技巧对于分段函数Y=gXEY=∑ᵢEY|条件i·P条件i条件期望EX|A=∑ᵢxᵢPX=xᵢ|A应用举例全期望公式EY=E[EY|X]某保险公司为汽车提供保险,赔付金额与事故类型有关Y X(轻微事故)元,概率•X=1Y=
50000.05(中度事故)元,概率•X=2Y=
200000.01(严重事故)元,概率•X=3Y=
500000.001计算期望赔付金额方差不等式切比雪夫不等式实际意义对任意随机变量和任意正数不论随机变量具体分布如何,其取值Xε距离期望较远的概率都很小P|X-EX|≥ε≤DX/ε²它为数据的波动性提供了通用的上界例P|X-EX|≥3σ≤1/9风险估计在金融投资、工程安全等领域,用于估计极端情况发生的概率上限,辅助风险控制伯努利实验与大数定律伯努利实验具有以下特点的随机试验只有两种可能结果成功或失败•每次试验成功概率固定不变•p各次试验相互独立•伯努利公式次伯努利试验中恰好成功次的概率n kPX=k=Cn,k·p^k·1-p^n-k单次与多次实验概率变化硬币正面朝上概率p=
0.5单次正面•P=
0.5次次正面•10P5=C10,5·
0.5^10≈
0.246次恰好次正面•100P50≈
0.08随着实验次数增加,频率与概率的偏差会减小大数定律初步伯努利大数定律切比雪夫大数定律在n次伯努利试验中,成功次数为Sn,则对于任意ε0对独立同分布的随机变量序列{X₁,X₂,...,Xn},若EXᵢ=μ,DXᵢ=σ²∞,则P|Sn/n-p|ε→1当n→∞时P|X̄n-μ|ε→1当n→∞时通俗解释试验次数足够多时,事件发生的频率几乎必然接近其概率通俗解释样本均值会收敛到总体均值大数定律在统计推断、蒙特卡洛模拟、保险精算等领域有广泛应用,是概率论中最基本的定律之一中心极限定理中心极限定理内容独立同分布的随机变量X₁,X₂,...,Xn,若EXᵢ=μ,DXᵢ=σ²,则₁₂的分布当时收敛到标准正态分布X+X+...+Xn-nμ/σ√n n→∞N0,1意义无论原始随机变量是什么分布,只要满足一定条件,它们的和的标准化后的分布都近似服从正态分布应用实例实际应用投票统计与误差±100052%
3.1%样本容量支持率误差范围在一次民意调查中,随机调查显示的人支持某置信水平下的抽样误52%95%抽取名选民政策差1000根据中心极限定理,样本比例̂近似服从正态分布,其中为总体比例p Np,p1-p/n p置信区间为̂±̂̂,时,(置信度),可计p z_α/2√[p1-p/n]n=1000z=
1.9695%算得误差范围约为±
3.1%简单数理统计原理总体与参数样本与统计量总体研究对象的全体样本从总体中抽取的部分个体参数描述总体特征的数量,如、等统计量由样本计算得到的量,如̄、等μσ²X S²点估计与区间估计假设检验点估计用一个值估计总体参数在给定的显著性水平下,根据样本数据判断关区间估计构造一个区间,以一定概率包含总于总体的假设是否合理体参数样本均值与样本方差样本均值̄₁₂X=X+X+...+Xn/n性质̄,̄EX=μDX=σ²/n样本方差S²=∑Xᵢ-X̄²/n-1性质(无偏估计)ES²=σ²计算示例样本数据2,4,6,8,10样本均值和样本方差是描述样本集中趋势和离散程度的重要统计量,是样本均值̄X=2+4+6+8+10/5=6进行统计推断的基础样本方差S²=[2-6²+4-6²+6-6²+8-6²+10-6²]/5-1=10最大似然估计与应用构建似然函数Lθ=fx₁,x₂,...,xn|θ=∏ᵢfxᵢ|θ其中为待估参数,为概率密度函数θf求对数似然函数ln Lθ=∑ᵢln fxᵢ|θ对数运算将乘积转化为求和,便于计算求导并令其等于零d/dθ[ln Lθ]=0解方程得到参数的最大似然估计̂θθ最大似然估计是一种常用的参数估计方法,其基本思想是选择一个参数值,使得在这个参数下观测到当前样本的可能性最大假设检验的初步理解基本概念原假设₀默认为真的假设,通常表示无差异H备择假设₁与原假设对立的假设H显著性水平犯第一类错误的最大概率,常用值有、α
0.
050.01值在原假设成立条件下,得到当前或更极端样本结果的概率P检验原则若值,则拒绝₀;若值,则不拒绝₀P≤αH PαH检验与应用t单样本检验t检验总体均值是否等于某个特定值₀μμ检验统计量̄₀t=X-μ/S/√n自由度n-1双样本检验t检验两个总体均值是否相等检验统计量̄₁̄₂₁₁₂₂t=X-X/√[S²/n+S²/n]自由度通过公式计算Welch-Satterthwaite医药实验例题某新药临床试验,测量名患者用药前后血压变化,样本均值为,样本标10-10mmHg准差为问药物是否有显著降压效果()?15mmHgα=
0.05经典案例分析年全国数学联赛概率题2010有限个人相互认识(认识关系是相互的)已知任取三人中必有两人互相认识证明可以把这些人分成两组,使得每组中的人互相都认识解析反证法若不能分成两组,则选取一个反例,可推导出存在三个人没有互相认识,与题设矛盾涉及图论和组合数学知识高考压轴题分析年全国高考数学Ⅰ卷第题,关于抽样和概率分布,考查了独立202121性判断和条件概率计算,是概率与统计知识的综合应用概率论常见习题汇总()11经典套路题三门问题三门中有一门后面藏有奖品,参赛者选择一门后,主持人会打开剩下两门中的一门空门,问参赛者是否要改变选择解应当改变选择原始选择正确的概率为,则另外两门中有奖品的概率为1/3主持人打开一个空门后,剩余的那一门包含奖品的概率仍为2/32/32经典套路题男孩女孩问题某夫妇生了两个孩子,已知至少有一个是女孩,求两个都是女孩的概率解设两个孩子性别为,则样本空间男男男女女男女女,X,YΩ={,,,,,,,}都是等可能的已知至少有一个是女孩,则限制在男女女男女女中,{,,,,,}所以两个都是女孩的概率为1/3概率论常见习题汇总()2易错题条件概率混淆易错题独立性判断一种疾病的发病率为,检测准确率为,若某人检测为阳性,已知,,∪,问与是否独立?
0.1%99%PA=
0.5PB=
0.6PA B=
0.8A B其真正患病的概率是多少?解∪PA∩B=PA+PB-PA B=
0.5+
0.6-
0.8=
0.3解设为患病,为检测阳性A B若独立则×PA∩B=PA·PB=
0.
50.6=
0.3PA|B=[PB|A·PA]/PB=所以与相互独立AB×××[
0.
990.001]/[
0.
990.001+
0.
010.999]≈
0.09生活中的概率应用()1彩票概率分析双色球彩票选择个红球()和个蓝球(),中奖概率为61-3311-16一等奖××C6,6C1,1/[C33,6C16,1]≈1/17,721,088保险与概率关系保险公司通过大数定律估算风险,确定保费,实现长期盈利例交通事故概率为,平均赔付万元,则每份保险的期望赔付为元,保险公司加上运营成本和利润后确定保费
0.01101000生活中的概率应用()
281.6%95%
0.05疫苗有效率置信区间显著性水平某新冠疫苗在临床试验中,接种组患病率比对照药效分析中常用的统计可靠度,表示重复抽样中医学研究常用标准,表示若原假设为真,拒绝它组低有的样本包含真实总体参数的最大错误概率
81.6%95%疫情数据分析广泛应用概率统计方法传染率估计、病例预测、疫苗效力评估、流行趋势分析等正确解读统计数据对防控决策至关重要概率思维与决策概率决策基本步骤识别可能的决策选项
1.列出各种可能的结果及其概率
2.评估每种结果的价值或效用
3.计算每个决策选项的期望值
4.选择期望值最优的决策
5.期望效用理论理性决策者会选择期望效用最大的选项博弈中的概率思想概率论未来发展与挑战人工智能中的概率大数据与概率分析量子概率理论贝叶斯网络、马尔可夫决策过程、随机梯度下降海量数据处理中的随机抽样技术量子计算中的概率解释等概率模型已成为机器学习的核心算法基础高维数据降维与特征提取的概率方法量子信息与经典概率理论的差异概率图模型帮助系统处理不确定性,实现决策AI社交网络分析中的随机图模型量子算法中的概率振幅干涉现象推理课程小结与知识结构图概率论体系结构基础概念随机事件、样本空间、概率定义条件概率条件概率公式、独立性、全概率公式、贝叶斯公式随机变量分布函数、概率密度、常见分布数字特征期望、方差、协方差、相关系数极限定理大数定律、中心极限定理统计推断参数估计、假设检验练习与答疑时间1常见疑问概率与频率的区别?1频率是统计值,随试验次数变化;概率是理论值,是频率的极限2常见疑问独立事件与互斥事件的区别?2独立一个事件的发生不影响另一事件的概率;互斥两事件不能同时发生概率不为的互斥事件必不独立03常见疑问如何判断使用哪种概率分布?3二项分布次独立重复的是否试验;泊松分布单位时间空间内随机n//事件发生次数;正态分布多因素共同作用的随机变量,如测量误差4常见疑问概率的加法公式与乘法公式如何选择?4涉及或关系用加法公式;涉及且关系用乘法公式。
个人认证
优秀文档
获得点赞 0