还剩29页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
概率论与数理统计概述概率论与数理统计是研究随机现象规律的数学分支它为科学决策和数据分析提供了重要工具本课程将深入探讨概率理论和统计方法的基本概念和应用概率的基本概念随机试验样本空间可重复的实验,结果不确定但有随机试验所有可能结果的集合规律事件概率样本空间的子集,表示某种结描述事件发生可能性的数值度果量条件概率和全概率公式条件概率在给定条件下事件发生的概率乘法公式计算复合事件概率的方法全概率公式利用互斥完备事件系计算概率贝叶斯公式定义应用贝叶斯公式用于计算在新信息下事件的后验概率广泛应用于医疗诊断、机器学习和决策分析随机变量及其分布定义分布函数随机变量是随机试验结果的数值描述随机变量取值概率的函数化表示密度函数连续型随机变量概率分布的导数离散型随机变量及其分布伯努利分布二项分布描述单次试验成功或失败的概率多次独立重复试验中成功次数的分布泊松分布描述单位时间内随机事件发生次数的分布连续型随机变量及其分布均匀分布1在给定区间内等可能分布指数分布2描述事件之间的等待时间正态分布3自然界中最常见的概率分布数字特征期望值1随机变量的平均值方差2描述随机变量离散程度标准差3方差的平方根矩4描述分布形状的高阶特征中心极限定理定理内容1独立同分布随机变量和的分布趋近于正态分布条件2样本量足够大,独立同分布意义3为许多统计方法提供理论基础点估计12样本均值样本方差总体均值的无偏估计总体方差的无偏估计3矩估计基于样本矩的参数估计方法区间估计置信区间置信水平以一定概率包含真实参数值的区间区间包含真实参数值的概率假设检验基础原假设被检验的假设,通常表示无差异备择假设与原假设相对的假设显著性水平犯第一类错误的最大允许概率p值在原假设下观测到当前或更极端结果的概率线性回归分析模型最小二乘法建立自变量和因变量之间的线性估计回归系数的常用方法关系决定系数评估模型拟合优度的指标方差分析总变异组间变异12数据总的离散程度不同组平均值之间的差异3组内变异4F检验每组内部的随机误差比较组间变异与组内变异的比值抽样原理简单随机抽样分层抽样每个个体被选中的概率相等将总体分层后在每层内随机抽样整群抽样将总体分组后随机选择若干组抽样分布样本均值分布1服从正态分布或t分布样本方差分布2服从卡方分布F分布3两个独立卡方变量比值的分布参数估计问题最大似然估计贝叶斯估计选择使样本出现概率最大的参数值结合先验信息和样本信息的估计方法假设检验问题单样本检验1检验单个总体参数双样本检验2比较两个总体参数配对样本检验3比较相关样本的差异方差分析4比较多个总体均值相关分析Pearson相关系数Spearman等级相关衡量线性相关程度适用于非线性单调关系偏相关分析控制其他变量影响后的相关性方差分析应用单因素方差分析研究一个因素对结果的影响双因素方差分析同时考虑两个因素的影响协方差分析控制协变量影响的方差分析非参数检验方法秩和检验符号检验比较两个独立样本的分布检验配对数据的中位数差异卡方检验分析分类数据的独立性或拟合优度时间序列分析趋势分析1研究长期变化趋势季节性分析2识别周期性变化模式ARIMA模型3综合自回归和移动平均的预测模型多元统计分析主成分分析因子分析降维和提取主要特征探索潜在因素结构判别分析聚类分析建立分类规则将观测对象分组数据挖掘概述数据预处理1清洗、转换和规范化数据模式发现2使用算法发现数据中的规律结果解释3评估和解释挖掘结果统计软件应用经典概率论问题生日问题三门问题计算群体中有人生日相同的概研究选择策略对获奖概率的影率响赌徒破产问题分析长期赌博中破产的概率随机过程基础定义分类随机过程是随时间变化的随机变量序列包括离散时间过程和连续时间过程马尔可夫链无记忆性未来状态只依赖于当前状态状态转移矩阵描述状态间转移概率平稳分布长期运行后的概率分布排队论到达过程服务过程描述顾客到达的随机性刻画服务时间的分布队列规则定义服务顺序和等待策略可靠性理论寿命分布1描述产品失效时间的概率分布故障率函数2反映产品在不同时期的失效风险系统可靠性3分析复杂系统的整体可靠性概率论与数理统计在实际应用中的作用。
个人认证
优秀文档
获得点赞 0