还剩28页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
概率与概率分布本课程将带你了解概率论的基础知识,并介绍常见的概率分布什么是概率?事件发生的可能性随机现象的描述概率是对事件发生的可能性进行概率是描述随机现象发生的规律度量,用一个介于到之间的数,并用于预测未来事件发生的可01值表示能性统计学的基础概率是统计学的基础,用于解释和分析数据,帮助人们了解事物发生的规律集合论与概率的关系样本空间1所有可能结果的集合事件2样本空间的子集概率3事件发生的可能性概率的基本公理公理1非负性公理2样本空间的概率公理3可加性对于任何事件,其概率大于等于样本空间的概率为对于相互排斥的事件和,或发生A0S1A B A B的概率等于发生的概率加上发生的概A B率条件概率定义公式应用条件概率是指在事件已经发生的情况下条件概率广泛应用于医疗诊断、金融风险B PA|B=PAB/PB,事件发生的概率,记为评估等领域A PA|B独立事件定义公式两个事件和相互独立,当且仅当事A BPA∩B=PAPB件的发生不影响事件发生的概率A B举例抛硬币两次,第一次抛硬币的结果不会影响第二次抛硬币的结果全概率公式公式PA=∑PA|BiPBi解释事件的概率等于事件在所有可能的互斥事件条件下的A A Bi概率之和,乘以事件的概率Bi应用计算事件的概率,当可能由多个互斥事件导致时A ABi贝叶斯公式PA|B PB|A后验概率似然概率事件发生后,事件发生的概率事件发生后,事件发生的概率BAA BPAPB先验概率边缘概率事件发生的概率事件发生的概率AB离散随机变量及其概率分布随机变量离散随机变量随机变量是一个数值变量,其值离散随机变量的值只能取有限个取决于随机事件的结果值或可数无限个值概率分布概率分布描述了随机变量取各个值的概率泊松分布泊松分布描述了在给定时间或空间内事件发生的概率它常用于分析稀有事件的发生频率例如,在某个时间段内,电话呼叫中心接到的电话数量或网站访问者数量二项分布二项分布是统计学中一种常见的离散概率分布,它描述了在次独n立试验中,事件发生的次数的概率分布在每次试验中,事件A XA发生的概率为,不发生的概率为二项分布的概率质量函数p1-p为PX=k=Cn,k*p^k*1-p^n-k其中,表示从次试验中选出次事件发生的组合数Cn,k nk A超几何分布超几何分布描述了从有限总体中随机抽取样本,其中每个样本都是独立的,并且抽取的样本不放回例如,从一个装有个红球和个蓝球的箱子里,105随机抽取个球,其中恰好有个红球的概率超几何分布可以用来计算从有32限总体中抽取样本的概率,并且它在质量控制、抽样调查等方面有着广泛的应用连续随机变量及其概率分布连续随机变量概率分布取值在一定范围内连续变化的随机变描述连续随机变量取值的概率规律量概率密度函数用于描述连续随机变量取值的概率密度均匀分布均匀分布是一种简单的概率分布,它描述了事件在某个区间内等概率发生的可能性例如,在一个连续的随机变量中,如果所有值在某个区间内等可能地出现,则该变量服从均匀分布正态分布形状公式应用正态分布的概率密度函数呈钟形,左右对称正态分布的概率密度函数由均值和标准差决正态分布广泛应用于自然科学、社会科学和,曲线下方的面积表示事件发生的概率定,可以使用公式计算特定区间内的概率工程领域,例如身高、体重、血压等正态分布的性质和应用对称性峰度应用广泛正态分布曲线关于其均值对称,意味着数正态分布曲线呈钟形,在均值处达到峰值正态分布广泛应用于自然科学、社会科学据在均值两侧的分布概率相同,反映数据的集中程度和工程领域,例如统计分析、质量控制和预测模型正态近似中心极限定理1大量独立随机变量的和近似于正态分布二项分布2当样本量足够大时,二项分布可近似为正态分布泊松分布3当事件发生概率较小时,泊松分布可近似为正态分布正态近似是一种重要的工具,它允许我们使用正态分布来近似其他分布,从而简化计算并提供有用的结论正态分布标准化标准化将任何正态分布转化为标准正态分布的过程公式,其中是标准正态随机变量,是原始正Z=X-μ/σZ X态随机变量,是均值,是标准差μσ优势简化计算和比较不同正态分布正态分布表及其应用正态分布表列出了标准正态分布中不同数值的概率使用正态分布表可以帮助我们快速找到特定范围内的概率值随机变量的数字特征期望方差随机变量的期望值是所有可能值随机变量的方差是其各个值与其的加权平均值,权重为每个值的期望值之差的平方的加权平均值概率,权重为每个值的概率标准差随机变量的标准差是其方差的平方根,表示随机变量值的分散程度期望EX VarX期望值方差随机变量取值的平均值随机变量取值与期望值的偏离程度SDX标准差方差的平方根,衡量数据分布的离散程度方差定义公式方差是用来衡量随机变量与其期望值之间的平均偏差程度的统计对于离散随机变量,其方差为其X VarX=E[X-E[X]²]量它反映了数据分布的离散程度,方差越大,数据越分散;方中,是的期望值E[X]X差越小,数据越集中标准差定义方差的平方根,衡量数据分布的离散程度公式σ=√VarX单位与随机变量相同的单位矩矩描述一阶矩期望,反映随机变量的中心位置二阶中心矩方差,描述随机变量的离散程度三阶中心矩偏度,衡量概率分布的偏斜程度四阶中心矩峰度,反映概率分布的尖锐程度偏度和峰度偏度峰度12衡量分布偏离对称性的程度衡量分布峰值的陡峭程度随机变量的函数分布函数变换分布类型将一个随机变量的函数作为新的随机了解函数变换后的随机变量的分布类变量型计算方法利用积分或求和方法计算新随机变量的概率分布随机变量和随机向量随机变量随机向量概率分布123随机变量是将随机事件的结果用数值随机向量是指多个随机变量组成的向随机变量和随机向量的概率分布描述表示的变量量了它们取值的概率...相关系数-10负相关不相关1正相关相关系数衡量两个变量之间的线性关系强度和方向从到的范围,表示完全负相关,表示完全正相关,表示不相关-11-110回归分析线性回归多元回归寻找自变量和因变量之间线性关多个自变量对因变量的影响系的模型非线性回归自变量和因变量之间的非线性关系总结与展望本课程介绍了概率论和概率分布的基础知识,为后续更深入学习统计学和数据分析奠定了基础。
个人认证
优秀文档
获得点赞 0