还剩9页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
统计学(第三版)课件第一章在我们日常生活中,统计学随处可见本章将带领您了解统计学的基础知识和应用,从而更好地理解和运用统计学概述统计学的定义和作用统计学是关于收集、分析和解释数据的科学,应用广泛,如医学、经济学等它可以帮助我们做出准确的预测和决策调查和样本调查是为了收集数据而进行的研究样本是从人群中随机抽取的一部分数据,代表着整个人群的特征数据的收集与整理数据的来源和类型数据的质量和清洗缺失值的处理数据可以从各种渠道获取,如调数据质量是指数据是否准确、完缺失值是指数据中部分数据缺失查问卷、互联网、观察等数据整、一致、可靠等,数据清洗是或无法获取我们需要通过删除、类型分为定量数据和定性数据两对数据进行处理和筛选,以确保插值等方法进行处理,以得到完类数据质量整的数据描述性统计中心位置的度量1均值、中位数、众数等是描述数据分布的量离散程度的度量2标准差、方差、极差等是描述数据分布分散程度的量分布的特征和形态3偏态、峰态、分位数等是描述数据分布特征和形态的量概率论概率的定义和性质概率是指某个事件发生的可能性,范围在到之间概率具有可加性和互补性等性质01随机变量及其分布随机变量是指取值为某个区间内任何数值的变量;分布是指随机变量取各个值的概率期望和方差期望是指随机变量的平均值;方差是指随机变量和其期望之差的平方的平均数,表示随机变量离其平均值的距离概率分布正态分布和标准化1正态分布是一种概率分布,具有对称性、单峰性等特点;标准化是对正态分布进分布和自由度t2行处理,使其均值为,方差为01分布是一种概率分布,通常用于小样本t的推断;自由度是指样本数量的一个重卡方分布和检验要参数3卡方分布是一种概率分布,用于样本数据的分布检验抽样分布中心极限定理抽样分布和样本误差中心极限定理是指在总体分布未知的情况下,样本抽样分布是指样本的统计量的不同取值,样本误差均值的分布会趋近于正态分布是指样本的统计量与总体参数之间的误差参数估计点估计和区间估计1点估计是从样本中推断总体参数的一种方法;区间估计是指利用样本数据估计总体参数的区间抽样误差和置信区间2抽样误差是指在采集样本时由于随机性导致的误差;置信区间是指置信水平下总体参数的估计区间假设检验假设检验的流程和原理假设检验是用于检验统计结论是否具有显著性的方法;流程包括设定假设、构造检验统计量和确定拒绝域等步骤显著性水平和值p显著性水平是指显著性检验时犯错误的概率;值是指计算得到的检验统计量到达或超过当p前值的概率类型错误和类型错误12类型错误是指拒绝了假设,但实际上假设却是正确的;类型错误是指接受了假设,但实12际上假设却是错误的线性回归简单线性回归和多元线性回归1线性回归是指利用自变量和因变量之间的线性关系来建立模型,并进行预测和最小二乘估计和显著性检验2分析;简单线性回归是只有一个自变量的回归模型,多元线性回归是包含两个最小二乘估计是求出回归系数的一种方或两个以上自变量的模型法;显著性检验是指检验回归方程在总体上是否显著模型的诊断和预测3模型的诊断需要对模型进行检验和改进;模型的预测通过回归方程来进行总结统计学在实践中的应用统计学的局限和不足统计学发展的前景与挑战统计学广泛应用于各个领域,如统计学只能分析数据,但无法解统计学的发展具有重要意义,尤医学、经济学、政治学等,帮助释与变量相关的因果关系,另外其是在数据科学和人工智能方面,我们更好地认识和解决问题在实际应用中还会面临到数据质但需要克服数据质量、模型复杂量、误差等问题度和算法可解释性等挑战。
个人认证
优秀文档
获得点赞 0