还剩28页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
《统计描述习题》课件PPT课程目标和大纲统计描述基础数据分析技巧掌握数据整理和可视化方法,并能运运用集中趋势、离散程度、偏态、峰用统计描述指标分析数据特征态等指标深入分析数据可视化表达熟练使用箱线图、直方图、散点图等图表进行数据展示数据整理与可视化数据清洗数据转换数据可视化处理缺失值、异常值和不一致数据将数据转换为合适的格式和单位使用图表和图形呈现数据,以增强理解和洞察力集中趋势度量平均数中位数反映数据集中趋势的最常用指标将数据从小到大排序后,位于中,用所有数据之和除以数据个数间位置的数据,不受极端值影响众数数据集中出现频率最高的数值,适用于离散型数据,可能有多个众数集中趋势例题例题1某班学生数学考试成绩如下80,85,75,90,88,92,83,求该班学生数学考试成绩的算术平均数、中位数86,81,89和众数例题2某公司销售员的月销售额如下(单位万元)20,25,30,求该公司销售员月销售额的算术28,32,26,24,29,31,27平均数、中位数和众数例题3某商店销售某种商品的单价如下元、元、元、元
10121518、元求该商品的平均单价、中位数和众数20集中趋势习题平均数1计算数据集的平均值中位数2找到数据集的中间值众数3确定数据集中出现频率最高的数值离散程度度量方差标准差极差四分位差反映数据围绕均值的波动程方差的平方根,与数据具有数据最大值与最小值的差值第三四分位数与第一四分位度,数值越大波动越大相同的单位,更易于理解,简单易懂但受极端值影响数的差值,不受极端值影响较大,更稳健离散程度例题方差1计算一组数据的方差,并解释其含义标准差2计算一组数据的标准差,并解释其与方差的关系极差3计算一组数据的极差,并解释其局限性四分位差4计算一组数据的四分位差,并解释其在描述数据分布中的作用离散程度习题练习1练习3计算一组数据的方差和标准差解释标准差对数据分布的影响123练习2比较两组数据的离散程度偏态度量偏度正偏态12描述数据分布的对称性数据偏向左侧众数小于均值.,.负偏态3数据偏向右侧众数大于均值,.偏态例题例题一某公司员工的工资数据,大部分员工工资集中在较低水平,少数员工工资较高,呈现右偏态分布12例题二某地区学生考试成绩,大部分学生成绩集中在中等水平,少数学生成绩特别高或特别低,呈现双峰偏态分布偏态习题计算偏态系数利用公式计算样本数据的偏态系数,判断数据分布的偏态程度识别偏态类型根据偏态系数的正负值,判断数据分布为左偏、右偏或近似对称分布解释偏态意义分析偏态对数据分析的影响,并解释偏态的实际意义峰态度量峰度反映数据分布的集中程度峰度越大,表示数据越集中在均值附近峰度小于3,称为低峰峰态例题峰度1衡量分布曲线尖峭程度峰度系数2大于,尖峰分布3例题3计算峰度系数峰态习题计算峰度1利用公式计算样本数据的峰度值判断峰态2根据峰度值判断样本数据的峰态类型解释峰态3解释峰态对数据分布的影响五数概括最小值第一四分位数中位数数据集中最小的数值将数据从小到大排序,25%的数据位数据集中排序后,位于中间位置的数于第一四分位数以下值第三四分位数最大值将数据从小到大排序,75%的数据位于第三四分位数以下数据集中最大的数值五数概括例题最小值1数据集中最小的值,代表数据范围的下限第一四分位数2将数据从小到大排序,第一个四分位数是前数据点25%的值中位数3将数据从小到大排序,中位数是数据集中间的值,代表数据分布的中心点第三四分位数4将数据从小到大排序,第三个四分位数是前数据点75%的值最大值5数据集中最大的值,代表数据范围的上限五数概括习题计算1求最小值、最大值、中位数、第一四分位数和第三四分位数分析2观察五数概括之间的关系,分析数据的分布特征应用3应用五数概括进行数据分析,例如绘制箱线图箱线图箱线图是一种以数据为基础的图形化方法,用于显示数据的分布情况它能帮助我们快速了解数据的中心位置、离散程度、偏度和异常值箱线图的特点在于它不受数据分布的影响,即使数据不满足正态分布,箱线图也能很好地展现数据特征箱线图主要由五个关键点构成最小值、第一四分位数、中位数、第三四分位数和最大值箱线图可以帮助我们识别数据的离群值那些位于箱线图外侧的点被称为离群值,它们可能是数据录入错误或数据本身存在的异常值箱线图例题数据整理1先将数据按从小到大排序,确定最大值、最小值、中位数、上四分位数和下四分位数绘制箱体2以箱体表示数据集中间的,箱体上下边界分别为上下四分位数50%绘制须线3从箱体延伸出两条须线,分别连接到最大值和最小值,或连接到倍四分位距之外的点
1.5箱线图习题数据分析利用箱线图分析数据的分布情况,包括中位数、四分位数、极值等异常值识别通过箱线图识别数据中的异常值,并分析其产生的原因组间比较使用箱线图比较不同组别数据的差异,例如不同地区的销售额比较相关分析相关系数正相关负相关衡量两个变量之间线性关系的强度和方向两个变量同时增加或减少一个变量增加时,另一个变量减少相关分析例题案例一1探讨身高和体重之间的关系收集数据并绘制散点图,观察数据趋势案例二2分析学习时间和考试成绩的关系通过相关系数计算,确定两者之间的线性关系强度案例三3研究广告支出和销售额之间的关系通过相关分析,评估广告投入的有效性相关分析习题例题11计算两个变量之间的相关系数,并解释其含义例题22判断两个变量之间是否存在线性相关,并解释其原因例题33分析两个变量之间的相关关系,并预测一个变量的变化对另一个变量的影响回归分析预测关系线性模型应用广泛123回归分析用来预测两个或多个变量最常见的回归模型是线性回归,它回归分析在经济学、金融学、市场之间的关系假设变量之间存在线性关系营销等领域都有广泛的应用回归分析例题销售额与广告支出1研究广告支出对销售额的影响房价与面积2分析房屋面积与房价之间的关系学生成绩与学习时间3探讨学习时间与学生成绩的关联回归分析习题简单线性回归利用或软件进行回归分析,并解释回归系数、平Excel SPSSR方值和值p多元线性回归考察多个自变量对因变量的影响,建立多元线性回归模型,并分析模型的显著性非线性回归当数据呈现非线性关系时,使用非线性回归模型进行拟合,例如指数回归或对数回归统计描述总结数据整理与可视化集中趋势度量离散程度度量偏态与峰态了解数据特点,有效呈现数反映数据中心位置,如平均描述数据分散程度,如方差分析数据分布形状,如偏度据信息数、中位数、众数、标准差、峰度问题讨论本节课程结束后,您可以提出任何疑问老师将会耐心解答您的问题,并帮助您进一步理解统计描述的应用思考与练习统计描述的概念集中趋势与离散程度统计描述在数据分析中的作用是解释集中趋势和离散程度的区别什么?和联系实际应用如何利用统计描述方法分析实际生活中遇到的数据?。
个人认证
优秀文档
获得点赞 0