还剩28页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
概率论双语教学课件Probability TheoryBilingual TeachingSlides目录Contents0102概率论基础随机变量Basic Conceptsof ProbabilityTheory Random Variables随机试验、样本空间、事件与概率的基本定义离散型与连续型随机变量的分布与性质0304数字特征大数定律与中心极限定理Moments andExpectation Laws of Large NumbersCentral LimitTheorem期望值、方差及其他重要统计量概率论的核心极限理论0506参数估计与假设检验应用案例EstimationHypothesis TestingPractical Applications统计推断的基本方法第一章概率论基础随机试验Random Experiment随机试验是概率论研究的基础对象,它具有三个重要特征可重复性、不确定性和可观察性定义在相同条件下可重复进行的试验,每次试验的结果事先无法确定,但所有可能的结果是已知的Definition:An experimentthat canbe repeatedunder thesame conditionswithuncertain outcomes,but all possible resultsare knownin advance.•可重复进行-Repeatable•结果不确定-Uncertain outcomes样本空间Sample Space样本空间是概率论中的基本概念,它包含了随机试验所有可能的结果,通常用符号Ω表示定义性质示例Definition PropertiesExamples随机试验所有可能结果的集合•互斥性任意两个结果不能同时发生掷骰子Ω={1,2,3,4,5,6}Set ofallpossibleoutcomes ofa•完备性必有一个结果发生抛硬币Ω={正面,反面}random experiment随机事件Event随机事件是样本空间的子集,表示我们感兴趣的某些特定结果的集合事件可以分为必然事件、不可能事件和随机事件必然事件定义样本空间Ω的任意子集称为随机事件,简称事件每次试验必然发生Definition:Any subsetof thesample spaceΩis calleda randomevent,or simplyan event.事件A掷出偶数={2,4,6}Event A:rolling aneven number={2,4,6}不可能事件每次试验都不会发生随机事件概率的定义Definition ofProbability概率是衡量随机事件发生可能性大小的数值,它为我们提供了量化不确定性的工具概率值介于0和1之间,0表示不可能事件,1表示必然事件概率的本质概率是事件发生的可能性度量Probability measuresthe likelihoodof anevent occurring古典概率PA=有利结果数/总结果数PA=Number offavorable outcomes/Total outcomes概率性质0≤PA≤1PΩ=1条件概率Conditional Probability条件概率是概率论中的重要概念,它描述了在已知某个事件发生的条件下,另一个事件发生的概率这种条件关系在实际应用中极为常见定义事件B在事件A已发生条件下的概率,记作PB|ADefinition:The probability of eventB giventhat eventA hasoccurred,denoted asPB|A.条件概率公式PB|A=PA∩B/PA,其中PA0条件概率反映了信息对概率的影响,新信息的获得会更新我们对事件发生可能性的判断独立性Independence独立性是概率论中的核心概念之一,它描述了两个或多个事件之间是否存在相互影响关系理解独立性对于正确应用概率理论至关重要数学表达PA∩B=PA×PB定义或PB|A=PB两事件互不影响发生概率Two eventsdo notaffect eachothers实际应用occurrence连续两次抛硬币的结果相互独立随机试验的直观理解Visual Understandingof RandomExperiments抛硬币实验Coin TossExperiment•样本空间{正面,反面}•Sample space:{Heads,Tails}•等概率事件P正面=P反面=
0.5第二章随机变量随机变量定义Definition ofRandomVariable随机变量是现代概率论的核心概念,它将抽象的随机现象转化为具体的数值,为我们提供了用数学方法研究随机现象的工具实数值映射函数随机变量的取值为实数样本空间将样本空间映射到实数的函数Random variabletakes realnumber随机试验的所有可能结果Function mappingoutcomes toreal valuesSamplespace ofrandom experimentnumbers随机变量通常用大写字母X,Y,Z表示,其取值用小写字母x,y,z表示离散型随机变量Discrete RandomVariable离散型随机变量是最基本的随机变量类型之一,其特点是取值可数在实际应用中,许多现象都可以用离散型随机变量来建模定义取有限个值或可列无穷多个值的随机变量称为离散型随机变量Definition:A random variable thattakes finiteor countableinfinite values.常见例子Common Examples:•掷骰子的点数X∈{1,2,3,4,5,6}•一天中接到的电话数量•产品的次品数量•顾客到达的人数连续型随机变量Continuous RandomVariable连续型随机变量能够取连续区间内的任意实数值,这类变量在自然科学和工程技术中广泛存在基本特征典型例子取连续区间内值的随机变量测量身高、体重、温度Takes valuesin acontinuous intervalExample:height,weight,temperature取值不可数无穷多个时间、距离、速度等物理量概率特性PX=a=0对任意实数a概率通过区间积分计算分布函数与概率密度函数Distribution FunctionProbability DensityFunction分布函数和概率密度函数是描述随机变量概率分布的重要工具,它们为我们提供了完整的概率信息离散型随机变量连续型随机变量概率质量函数PMF概率密度函数PDFPX=xᵢ=pᵢ,i=1,2,...fx≥0对所有x•pᵢ≥0对所有i•∫₋∞^∞fxdx=1•Σpᵢ=1•PaXb=∫ᵇₐfxdx•描述每个取值的概率•描述概率密度累积分布函数CDF累积分布函数CDFFx=PX≤x=Σ{i:xᵢ≤x}pᵢ数学期望Expectation数学期望是随机变量最重要的数字特征之一,它反映了随机变量取值的平均水平,在概率论和统计学中具有核心地位物理意义连续型计算随机变量的加权平均值E[X]=∫₋∞^∞x fxdxWeighted averageof therandomvariable对概率密度函数加权积分反映随机变量的中心位置积分域为整个实数轴123离散型计算E[X]=ΣᵢxᵢPX=xᵢ每个可能值乘以其发生概率然后求和方差与标准差VarianceStandard Deviation方差和标准差是衡量随机变量离散程度的重要指标,它们描述了随机变量取值相对于期望值的波动程度方差的定义衡量随机变量离散程度的数字特征Definition:Measure ofspread ordispersion aroundthe expectedvalueVarX=E[X-E[X]²]=E[X²]-[E[X]]²标准差方差的正平方根,记作σ或SDXσ=√VarX方差的性质方差与标准差的几何意义•VarX≥0,当且仅当X为常数时等号成立•VaraX+b=a²VarX•若X,Y独立,则VarX+Y=VarX+VarY概率密度函数示例Probability DensityFunction Examples正态分布是最重要的连续概率分布之一,其概率密度函数具有钟形曲线的特征许多自然现象和测量误差都遵循正态分布正态分布特征数学表达式•关于均值μ对称fx=1/σ√2πe^-x-μ²/2σ²•标准差σ决定曲线的陡峭程度其中•68-95-
99.7规则•μ是均值参数•在μ±σ范围内约68%的数据•σ是标准差参数•记作X~Nμ,σ²第三章大数定律与中心极限定理Chapter3:LawsofLarge NumbersCentral LimitTheorem大数定律Law ofLargeNumbers大数定律是概率论中的基本极限定理之一,它揭示了随机现象的稳定性规律,为统计学的理论基础提供了重要支撑基本思想数学表述实际意义样本均值趋近于总体均值设X₁,X₂,...,X独立同分布频率稳定于概率ₙSample meanconverges topopulation E[Xᵢ]=μ,则样本统计量收敛到总体参数meanX₁+...+X/n→μn→∞为统计推断提供理论依据ₙ随着样本量增大大数定律告诉我们偶然中蕴含着必然,随机中体现着规律中心极限定理Central LimitTheorem中心极限定理是概率论中最重要的定理之一,它解释了为什么正态分布在自然界中如此普遍,并为统计推断提供了理论基础定理内容设X₁,X₂,...,X是独立同分布的随机变量,E[Xᵢ]=μ,VarXᵢ=σ²ₙ∞,则当n足够大时即样本均值的标准化变量渐近服从标准正态分布Key insight:Sum ofmany i.i.d.variables tendsto normaldistribution,regardlessof theoriginal distributionshape.重要特点•与原始分布形状无关•n≥30时近似效果较好•为统计推断奠定基础应用示例抛硬币实验通过经典的抛硬币实验,我们可以直观地理解大数定律和中心极限定理的实际应用和深刻含义1001K10K抛掷次数抛掷次数抛掷次数正面比例
0.48正面比例
0.503正面比例
0.4998偏离理论值较大接近理论值
0.5非常接近理论值100K抛掷次数正面比例
0.50001几乎等于理论值观察结果随着抛硬币次数的增加,正面出现的频率越来越接近理论概率
0.5,这正是大数定律的体现Observation:As thenumber ofcoin tossesincreases,the proportionof headsapproaches thetheoreticalprobabilityof
0.
5.第四章参数估计与假设检验Chapter4:EstimationHypothesisTesting点估计Point Estimation点估计是统计推断的基本方法之一,通过样本数据来估计总体参数的未知数值这个过程将样本信息转化为对总体的认识样本数据估计量从总体中抽取的观测值用样本统计量估计总体参数Observable sampledata Samplestatistics asestimators评价准则点估计值无偏性、一致性、有效性参数的具体数值估计Unbiasedness,consistency,efficiency Specificnumerical estimate常用估计方法矩估计法、最大似然估计法、贝叶斯估计法等每种方法都有其适用条件和优缺点区间估计Interval Estimation与点估计不同,区间估计给出参数可能取值的一个区间范围,并用概率来度量这个区间包含真实参数值的可能性大小置信区间以一定概率包含未知参数真值的随机区间Confidence Interval:A randominterval thatcontains thetrue parametervalue witha specifiedprobability.基本要素置信水平通常取90%,95%,99%置信区间[θ̂L,θ̂U]置信度Pθ̂L≤θ≤θ̂U=1-α置信水平越高,区间越宽;样本量越大,区间越窄解释注意置信区间的正确解释是如果重复抽样,约有95%的区间会包含真实参数值假设检验Hypothesis Testing假设检验是统计推断的另一个重要分支,它通过样本数据来检验关于总体参数的假设是否成立,为科学决策提供客观依据0102建立假设选择统计量提出原假设H₀和备择假设H₁选择适当的检验统计量State nullhypothesis H₀and alternativeH₁Choose appropriatetest statistic0304确定拒绝域做出决策根据显著性水平确定临界值根据样本值判断是否拒绝原假设αDetermine criticalregion based onαMake decisionbasedonsample evidence例检验正态总体均值μ是否等于μ₀H₀:μ=μ₀vs H₁:μ≠μ₀值与显著性水平p显著性水平值αp p-value显著性水平是我们事先设定的拒绝原假设的概率上限,通常取
0.05或
0.01p值衡量观察结果与原假设的兼容性程度,是支持原假设的证据强度的度量•α=
0.055%的显著性水平•p值越小,反对H₀的证据越强•α=
0.011%的显著性水平•pα时拒绝原假设•犯第一类错误的最大概率•提供了更精确的判断依据Significance levelα:The probabilityof rejectingH₀when itstrue TypeI error.p-value:Measures compatibilityof datawith nullhypothesis.5%1%10%常用显著性水平严格显著性水平宽松显著性水平社会科学研究中最常用医学研究中常用探索性研究中使用第五章概率论应用案例Chapter5:Applications ofProbabilityTheory应用领域Applications inVarious Fields概率论作为现代数学的重要分支,在各个领域都有广泛而深入的应用从传统的统计学到现代的人工智能,概率论都扮演着不可替代的角色风险管理机器学习统计推断质量控制Risk ManagementMachine LearningStatistical InferenceQuality Control金融市场风险评估、保险精算、投贝叶斯学习、概率图模型、随机优参数估计、假设检验、回归分析工业生产中的质量监控、缺陷检资组合优化概率模型帮助量化和化算法概率论为AI提供了处理不统计学的理论基础完全建立在概率测、过程改进概率方法确保产品管理各种不确定性风险确定性的数学框架论之上质量的稳定性结束语Conclusion概率论是理解和分析不确定世界的强大数学工具,它为我们提供了科学的思维方式和分析方法Probability theoryis fundamentalto understandinguncertainty-it providesus withscientific thinkingand analyticalmethodsfor dealingwith randomness.理论意义实用价值数学体系的重要组成部分广泛应用于各个领域其他学科的理论基础解决实际问题的有效工具学习建议注重理论与实践结合培养概率思维我们鼓励大家继续深入学习概率论的高级理论和前沿应用,在实践中不断提高运用概率方法解决问题的能力We encouragefurther studyand practiceto developexpertise inapplying probabilisticmethods toreal-world problems.谢谢大家!Thank You!。
个人认证
优秀文档
获得点赞 0