还剩30页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
概率论复习重点概率论的基本概念随机现象样本空间事件在一定条件下,其结果不确定的现象随机现象所有可能结果的集合样本空间的子集,代表随机现象中感兴趣的结果频率与概率的关系频率1在大量重复试验中,事件发生的次数与试验总次数的比值称为频率概率2事件发生的可能性大小,用一个介于到之间的数值表示01关系3当试验次数足够多时,频率会趋近于概率,即频率是概率的近似值集合论在概率论中的应用事件的表示概率的计算条件概率集合论中的概念,例如并集、交集、补集合论可以用来计算概率,例如事件和集合论可以用来计算条件概率,例如已A集等,可以用来表示事件,例如事件和事件的交集的概率表示事件和事件同知事件发生的情况下事件发生的概率A B A BA B事件的并集表示事件或事件发生时发生的概率,可以用集合论中的条件概率公式来计BA B算事件的运算并交事件或事件发生,或两者都发生事件和事件同时发生A BA B差补事件发生,但事件不发生事件不发生A BA古典概型有限样本空间事件概率计算12古典概型适用于样本空间有限事件的概率等于该事件包含的且每个基本事件等可能的情况基本事件数除以样本空间中基本事件总数应用举例3掷骰子、抽签等事件的概率计算可以用古典概型等概事件定义所有事件发生的可能性相等举例抛掷一枚均匀硬币,出现正面或反面的概率均为1/2应用从一副标准扑克牌中随机抽取一张,抽到任意一张牌的概率均为1/52条件概率定义公式事件已经发生的条件下,事件A BPB|A=PAB/PA发生的概率,记为PB|A应用用于分析事件之间的依赖关系,以及预测未来事件发生的可能性事件的独立性相互独立条件概率两个事件和相互独立,意味着事件的发生不会影响事件发生当事件和相互独立时,事件发生的概率与事件是否发生无关A BA BA BAB的概率,反之亦然,即和PA|B=PA PB|A=PB贝叶斯公式公式应用12用于更新事件发生的概率,PA|B=PB|A*PA/A基于事件已发生的信息PB B.用途3广泛应用于机器学习,医学诊断,和风险评估.离散型随机变量定义随机变量是指其值由随机事件决定,取值可以是有限个或可数无限个的变量离散型离散型随机变量的值可以列举出来,而且这些值之间存在间隔概率质量函数离散型随机变量的概率质量函数描述了每个取值的概率概率质量函数定义离散型随机变量取每个值的概率符号PX=x性质所有概率值的总和为1用途计算离散型随机变量的期望、方差期望EX VarX期望值方差随机变量的平均值随机变量的离散程度方差方差是衡量随机变量与其期望值之间偏差的平方和的平均值标准差1方差的平方根2度量分散程度反映随机变量取值与期望值的平均偏差3单位一致与随机变量具有相同的单位联合概率分布定义应用联合概率分布描述了多个随机变量同时取值的概率它表示了这联合概率分布在统计学和机器学习中广泛应用,例如用于推断多些变量之间相互关系的程度个变量之间的关系,预测未来事件,以及构建模型等边缘概率分布联合概率分布求和或积分边缘概率分布是从联合概率分布对于离散随机变量,可以通过将中推导出来的,它描述了单个随联合概率分布中所有其他变量的机变量的概率分布,而不考虑其取值相加得到边缘概率分布对他变量于连续随机变量,可以使用积分来求得边缘概率分布独立性当两个随机变量相互独立时,它们的边缘概率分布与联合概率分布相同条件概率分布定义应用例子条件概率分布是指在已知某个事件发在实际问题中,我们经常需要考虑在例如,在已知学生成绩高于平均分的生的情况下,另一个事件发生的概率某个条件下,某个事件发生的概率情况下,学生性别为男性的概率分布相互独立的随机变量定义如果两个随机变量和的联合概率分布等于它们各自边缘概率分布的乘积,则称X YX和相互独立Y特性独立随机变量的协方差为,但协方差为不一定意味着独立00应用独立性是概率论中重要的概念,用于分析随机事件的相互影响,例如,模拟掷骰子结果协方差和相关系数协方差相关系数衡量两个随机变量之间线性关系的强度和方向协方差的标准化形式,取值范围为到,更易于比较-11切比雪夫不等式定义应用切比雪夫不等式是概率论中一个重要的不等式,它给出了随机变切比雪夫不等式可以用于估计随机变量落在某个特定范围内的概量偏离其期望值的概率的上界率,而不需要知道随机变量的具体分布大数定律大量重复试验频率稳定当进行大量的独立随机试验时,事件发生的频率会趋近于其概率随着试验次数的增加,频率会逐渐稳定在某个数值附近泊松分布时间间隔在特定时间间隔内发生的事件数量随机事件事件发生是随机的,但平均发生率是已知的独立事件每个事件的发生与其他事件无关二项分布定义条件12二项分布描述了在一定次数的每次试验的结果只有两种可能独立试验中,事件发生的次数成功或失败,且每次试验的的概率分布成功概率相同应用3二项分布在很多领域都有应用,例如质量控制,市场调查,医学研究正态分布对称钟形重要性正态分布曲线关于平均值对称曲线呈钟形,两端渐进地趋近于横轴在统计学和概率论中,正态分布是最重要的一种分布正态分布的性质对称性峰度标准差正态分布曲线关于均值对称,意味着数正态分布曲线呈钟形,中心最高,两端标准差决定了正态分布曲线的宽度,标据在均值两侧的分布是相同的逐渐下降,表示大多数数据集中在均值准差越大,曲线越平缓,数据越分散附近正态分布的标准化标准化1将任意正态分布转换为标准正态分布公式2Z=X-μ/σ意义3方便比较不同正态分布中心极限定理大样本当样本量足够大时,样本均值的分布趋近于正态分布,无论原始总体分布如何正态近似这个定理使我们可以用正态分布来近似估计许多随机变量的分布,即使我们不知道它们的真实分布统计推断中心极限定理是统计推断的基础,它允许我们从样本数据中推断总体特征区间估计置信区间置信水平用于估计总体参数的范围,并提供置信度水平表示估计区间包含总体参数的概率假设检验检验假设显著性水平假设检验用于验证关于总体参显著性水平定义了拒绝原假设数的假设的风险P值值表示在原假设为真的情况下,观察到样本数据的概率P卡方检验拟合优度检验检验样本分布是否符合预期的理论分布独立性检验检验两个分类变量之间是否相互独立同质性检验检验不同组别之间总体分布是否相同结语概率论是数学的重要分支,在统计学、机器学习、金融等领域都有着广泛的应用希望通过本次复习,大家能够对概率论的基本概念和方法有更深入的理解。
个人认证
优秀文档
获得点赞 0