还剩28页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
统计初步本课程将介绍统计学的基本概念、方法和应用我们将探讨数据收集、分析和解释的各个方面,为您打开统计学的大门统计学的基本概念总体与样本变量与数据总体是研究对象的全体,样变量是可测量的特征,数据本是从总体中抽取的部分是变量的具体观测值描述统计与推断统计描述统计summarizes数据,推断统计从样本推断总体特征统计学的应用领域医疗卫生经济金融教育研究工业制造用于临床试验、流行病学研应用于市场分析、风险评估用于教育效果评估、学生成用于质量控制、生产效率优究和健康政策制定和经济预测绩分析等化等方面统计数据的基本特征定量数据定性数据离散数据连续数据可以精确测量的数值型数据描述性质或类别的数据,如只能取特定值的数据,如家可以取任意值的数据,如时,如身高、体重性别、职业庭成员数间、距离统计数据的收集方法调查法1通过问卷或访谈直接从研究对象收集数据观察法2直接观察并记录研究对象的行为或特征实验法3在控制条件下进行实验,收集相关数据文献法4从已有的文献、报告中收集二手数据统计数据的组织与表示频数分布表相对频数分布表将数据按类别或区间分组,显显示每组数据占总体的比例示每组的频数累积频数分布表交叉分类表显示数据累积到某一类别或区同时按两个或多个变量分类的间的频数频数分布表图表在统计中的应用集中趋势的度量众数1出现次数最多的数值中位数2排序后处于中间位置的数值算术平均数3所有数值的和除以数据个数平均数的计算及应用数据收集收集所有相关数据求和计算所有数据的总和除以个数总和除以数据的个数解释结果分析平均数的含义中位数的计算及应用数据排序1将所有数据从小到大排列确定中间位置2找出排序后的中间位置计算中位数3奇数个数取中间值,偶数个数取中间两数平均应用分析4解释中位数在数据分布中的意义众数的计算及应用数据整理频数统计12将数据按类别或数值分组计算每个类别或数值的出现次数确定众数结果分析34找出出现次数最多的类别或解释众数在数据分布中的意数值义离散趋势的度量极差方差标准差最大值与最小值之差,反映数据的总体各观测值与平均数离差平方的平均值,方差的平方根,用原始单位表示离散程分散程度反映离散程度度极差的计算及应用找出最大值在数据集中找出最大的数值找出最小值在数据集中找出最小的数值计算差值用最大值减去最小值解释结果分析极差反映的数据分散程度方差和标准差的计算及应用计算平均数1求出所有数据的算术平均值计算离差2每个数据与平均数的差平方离差3将每个离差平方求平均4所有平方离差的平均值即为方差开平方5方差的平方根即为标准差正态分布及其性质对称性钟形曲线正态分布曲线关于平均数对称分布呈钟形,中间高两边低68-95-
99.7法则广泛应用分别表示落在
1、
2、3个标准差许多自然和社会现象都近似服范围内的数据比例从正态分布概率的基本概念事件样本空间可能发生的结果或结果的集合所有可能结果的集合概率随机试验事件发生的可能性,取值在0到1之在相同条件下可重复进行的试验间条件概率及其应用定义计算公式应用在已知某事件B发生的条件下,事件A PA|B=PA∩B/PB用于分析事件之间的相关性和依赖关系发生的概率贝叶斯定理及其应用定理公式先验概率PA|B=PB|A*PA/PB事件发生前的已知概率后验概率应用领域根据新信息更新的概率机器学习、医疗诊断、风险评估等假设检验的基本概念提出假设1建立原假设和备择假设确定显著性水平2通常选择
0.05或
0.01计算检验统计量3根据样本数据计算做出决策4比较p值和显著性水平,接受或拒绝原假设检验在比例与均值检验中的Z应用大样本已知总体标准差适用于样本量大于30的情况总体标准差已知时使用比例检验均值检验用于检验总体比例是否等于某用于检验总体均值是否等于某个特定值个特定值检验在小样本均值检验中的应用T小样本未知总体标准差应用场景适用于样本量小于30的情况总体标准差未知时使用单样本、配对样本和独立样本的均值检验方差分析在均值比较中的应用多组比较方差分解12用于比较三个或更多组的均将总变异分解为组间变异和值差异组内变异F检验应用领域34使用F统计量进行假设检验产品质量控制、医学研究、心理学实验等卡方检验在分类数据分析中的应用独立性检验拟合优度检验检验两个分类变量是否相互独立检验观察频数与理论频数的一致性同质性检验应用领域检验不同总体的分布是否相同市场调研、社会学调查、医学研究等回归分析的基本概念预测1根据自变量预测因变量的值关系建模2建立自变量和因变量之间的数学模型变量选择3识别对因变量有显著影响的自变量假设检验4检验回归系数的显著性一元线性回归模型的建立与应用数据收集收集自变量和因变量的数据散点图绘制观察变量间的关系参数估计使用最小二乘法估计回归系数模型评估分析决定系数和残差多元线性回归模型的建立与应用变量选择模型构建多重共线性模型诊断选择多个相关自变量建立包含多个自变量的线性检测和处理自变量间的相关分析残差、影响点和异常值方程性相关分析的基本概念及应用相关系数正相关衡量两个变量之间线性关系的强度一个变量增加,另一个变量也增加负相关无相关一个变量增加,另一个变量减少两个变量之间没有线性关系抽样调查的基本方法简单随机抽样分层抽样从总体中随机选取样本将总体分层后在各层内随机抽样系统抽样整群抽样按固定间隔选取样本将总体分成若干群,随机选取整群大数定律及其应用定义1样本均值随样本量增大而趋近于总体均值弱大数定律2概率收敛于总体均值强大数定律3几乎必然收敛于总体均值应用4用于保险精算、质量控制等领域中心极限定理及其应用定理内容适用条件大样本的均值近似服从正态样本量足够大,通常大于30分布重要性应用领域为许多统计推断方法提供理抽样调查、假设检验、置信论基础区间估计等。
个人认证
优秀文档
获得点赞 0