还剩32页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
数理统计欢迎来到数理统计课程!统计学概述数据分析决策支持统计学是通过收集、整理、分析统计学为决策提供科学依据,帮和解释数据来研究和理解现象的助人们从数据中提取有价值的信学科息预测未来统计学可以用于预测未来趋势,例如市场需求、经济增长等统计学的定义
1.1数据分析信息提取决策支持统计学是收集、整理、分析和解释数据的科它通过对数据的观察和分析,发现数据背后统计学为决策提供依据,帮助人们做出明智学方法的规律和趋势的判断统计学的特点
1.2数据驱动的客观性12统计学以数据为基础,利用数统计方法旨在消除主观因素的据来描述和分析现实世界的问影响,力求客观地反映事物的题本质规律概括性3统计学通过对大量数据进行分析,得出结论,并用简洁的指标概括数据特征统计学的应用范围
1.3自然科学社会科学工程技术医疗卫生物理学、化学、生物学等领域经济学、社会学、心理学等领质量控制、可靠性分析、生产临床试验、流行病学研究等领,使用统计方法分析实验数据域,通过统计分析数据,了解过程管理等领域,应用统计方域,借助统计分析数据,评估,验证理论模型,推断规律社会现象,预测未来发展趋势法提高产品质量,优化生产效药物疗效,研究疾病发生机制率统计调查与数据收集
2.数据是统计分析的基础,而统计调查则是获取数据的关键环节调查目的调查对象明确调查目标,确定所需数据类型确定调查的总体和样本,并进行科学抽样统计调查的步骤
2.1确定调查目标1明确调查目的和范围,确定要收集的指标和数据设计调查方案2制定调查方法、调查对象、调查时间、调查工具等收集数据3根据调查方案进行数据收集,确保数据准确性和完整性整理数据4对收集到的数据进行分类、汇总、整理,形成统计资料分析数据5运用统计方法对整理后的数据进行分析,得出结论和建议统计调查方法
2.2抽样调查全面调查从总体中抽取部分样本进行调查,根对总体所有单位进行调查,适用于总据样本数据推断总体特征体规模较小或需要了解总体所有单位的情况实验调查通过控制条件进行实验,观察和分析实验结果,研究事物之间的因果关系数据的收集与整理数据清洗1处理缺失值、错误值等数据转换2对数据进行标准化、归一化等数据汇总3计算统计量、生成图表等描述性统计方法描述性统计方法用于概括和总结数据特征,帮助我们更好地理解数据集中趋势离散程度描述数据集中程度,如平均数、中位描述数据分散程度,如方差、标准差数、众数等、四分位差等集中趋势的度量
3.1平均数中位数众数反映数据集中趋势最常用的指标,代表所将所有数据值按大小顺序排列后,位于中数据集中出现频率最高的数值,适用于离有数据值的平均水平间位置的数值,不受极端值的影响散型数据,反映数据集中出现最多的数值离散程度的度量
3.2方差标准差数据点与其平均值的平均偏差的平方方差的平方根,表示数据点围绕平均值的典型偏差四分位距第三四分位数和第一四分位数之间的差值,表示数据分布的中间数据50%的范围偏斜度和峰度
3.3偏斜度峰度度量数据分布对称性的程度度量数据分布峰值尖锐程度概率论基础
4.随机事件随机变量在一定条件下,可能发生也可能不发随机变量是指其取值随随机事件的结生的事件称为随机事件例如,抛硬果而变化的变量例如,抛硬币的次币正面朝上是一个随机事件数是一个随机变量随机事件
4.1随机事件的定义随机事件的分类随机事件是指在一定条件下,可随机事件可以分为基本事件、复能发生也可能不发生的事件例合事件和互斥事件等如,抛一枚硬币,正面朝上是一个随机事件随机事件的概率随机事件发生的可能性可以用概率来表示,概率是指在一定条件下,某事件发生的可能性大小随机变量
4.2定义分类12随机变量是将随机事件的结果随机变量可分为离散型和连续用数值表示的变量型应用3随机变量在统计分析中至关重要,它们为我们提供了量化随机现象的工具概率分布
4.3离散型概率分布连续型概率分布伯努利分布、二项分布、泊松分布等正态分布、指数分布、均匀分布等抽样分布从总体中随机抽取样本,样本统计量的分布称为抽样分布重要性应用抽样分布是统计推断的基础,用于估帮助我们理解样本统计量的变异性,计总体参数和检验假设并根据样本信息推断总体特征抽样分布的定义
5.1定义关键应用123从总体中随机抽取样本,样本统计量它描述了样本统计量在多次抽样中的抽样分布为推断总体特征提供了理论的分布称为抽样分布变化规律,例如样本均值的分布基础,例如估计总体参数或检验假设采样分布与抽样误差
5.2采样分布抽样误差统计量在多次重复抽样中所形成抽样误差是指样本统计量与总体的分布称为采样分布它描述了参数之间的差异它反映了由于统计量在不同样本中变化的规律样本的随机性而导致的估计偏差正态分布与分布
5.3t正态分布分布t钟形曲线,用于描述许多自然现象和社会现象,在统计学中扮演重当样本量较小或总体方差未知时,用于估计总体均值,与正态分布要角色类似但尾部更厚参数估计参数估计是根据样本信息推断总体参数的真实值点估计区间估计用样本统计量直接估计总体参数的值根据样本统计量,构造一个包含总体参数的区间点估计
6.1定义方法点估计是指用样本统计量来估计总体参数的值常用的点估计方法包括矩估计法、最大似然估计法和贝叶斯估计法区间估计
6.2定义置信区间12区间估计是指根据样本数据对置信区间是指在给定置信度下总体参数的取值范围进行估计,总体参数可能落入的范围,并给出置信度置信度3置信度是指总体参数落在置信区间内的概率假设检验假设检验是一种统计推断方法,用于检验关于总体参数的假设是否成立基本概念步骤假设检验的目的是通过样本信息来判假设检验通常包括建立假设、收集数断总体参数是否符合预先设定的假设据、计算检验统计量、判断假设是否拒绝假设检验的基本概念原假设备择假设检验统计量值P关于总体参数的陈述,需要用与原假设相矛盾的陈述,是希基于样本数据计算的统计量,在原假设为真的情况下,观察样本数据来验证望通过检验来支持的结论用于比较样本数据与原假设的到样本结果或更极端结果的概差异率假设检验的步骤
7.2建立假设1确定要检验的假设,即零假设和备择假设选择检验统计量2根据数据类型和假设检验的目标选择合适的检验统计量确定拒绝域3根据显著性水平确定检验统计量取值的拒绝域计算检验统计量的值4根据样本数据计算检验统计量的值做出决策5判断检验统计量的值是否落在拒绝域内,并做出相应的决策检验和检验
7.3Z t检验适用于大样本情况,样本量大于检验适用于小样本情况,样本量小于Z t,且总体方差已知,总体方差未知3030方差分析比较多个样本均值组间差异和组内差异方差分析用于检验多个样本均值之间通过比较组间差异和组内差异的大小是否存在显著差异来判断样本均值的差异是否显著单因素方差分析
8.1比较不同组别的均值只有一个自变量检验不同组别的均值是否存在显自变量有不同的水平,每个水平著差异对应一个样本组假设检验检验组间差异是否大于随机误差双因素方差分析两个或多个因素交互作用研究两个或多个因素对因变量的影响检验因素之间是否相互影响相关与回归分析相关分析探讨变量之间的相互关系,而回归分析则是利用已知的变量来预测未知变量的值相关分析回归分析衡量两个变量之间线性关系的强弱程通过一个或多个自变量来预测因变量度的值相关分析
9.1定义类型相关分析研究变量之间线性关系相关分析分为正相关、负相关和的密切程度,即变量之间相互影无相关,分别表示变量之间是同响的大小向变化、反向变化或无变化方法常用的相关分析方法包括相关系数和秩相关系数Pearson Spearman回归分析
9.2线性回归非线性回归建立自变量和因变量之间线性关系的模型建立自变量和因变量之间非线性关系的模型。
个人认证
优秀文档
获得点赞 0