还剩29页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
《统计基础第二章》ppt课件•统计基础概述•统计数据的收集与整理•描述性统计•概率与概率分布目录•参数估计与假设检验•回归分析contents01统计基础概述统计学的定义与特点总结词描述统计学的定义和主要特点详细描述统计学是一门研究数据收集、整理、分析和推断的科学它具有以下特点客观性、数量性、总体性和具体性统计学的重要性与应用领域总结词阐述统计学的重要性和应用领域详细描述统计学在各个领域中都有广泛的应用,如经济学、社会学、医学、心理学等它对于决策制定、预测和解决问题具有重要意义统计学的历史与发展总结词概述统计学的历史和发展趋势详细描述统计学起源于17世纪中期的政治算术,随着数据收集和分析技术的发展,逐渐形成了多个分支领域现代统计学结合了计算机技术、数学和相关学科,呈现出多元化和跨学科的发展趋势02统计数据的收集与整理统计数据的来源与分类统计数据的来源统计调查、观测、试验、文献资料等统计数据的分类按照不同的分类标准,如数据来源、调查方式、计量单位等,可以将统计数据分为不同的类型统计调查方案的设计确定调查目的和任务确定调查对象和调查单位设计调查指标和调查表确定调查时间和调查期限统计调查的实施与数据整理调查前的准备工作数据整理阶段对收集到的数据进行审核、分类、汇包括组织领导、人员培训、物资准备总、制表等处理,使其系统化、条理等化,便于进一步的分析和应用调查实施阶段按照调查方案的要求进行调查,并做好记录和数据收集工作数据的质量控制与误差处理数据质量控制的意义数据质量控制的方法为了保证数据的准确性和可靠加强数据审核、建立数据质量性,必须对数据的质量进行控评估体系、采用科学的数据处制理方法等数据误差的种类误差处理的方法登记误差、代表性误差、系统对误差进行识别、评估和处理,性误差等如采用加权平均数、中位数等方法减少误差的影响03描述性统计数据的集中趋势描述010203平均数中位数众数计算所有数据的总和,然将数据从小到大排序后,出现次数最多的数据即为后除以数据的数量,得到位于中间位置的数即为中众数平均数位数数据的离散程度描述方差各数据与平均数的差的平方的平均数标准差方差的平方根变异系数标准差与平均数的比值数据分布的偏态与峰态描述偏态描述数据分布的不对称性,正偏态表示数据偏向大值,负偏态表示数据偏向小值峰态描述数据分布的尖锐程度,正峰态表示数据分布尖锐,负峰态表示数据分布平坦数据的其他描述性统计指标四分位数将数据分为四等分,分别对应最小值、下四分位数、中位数、上四分位数和最大值百分位数将数据分为100等分,第p百分位数表示有p%的数据小于或等于该值04概率与概率分布概率的基本概念必然事件互斥事件概率等于1的事件,如抛硬币两个事件不能同时发生正面朝上概率随机事件对立事件描述随机事件发生可能性的量概率介于0和1之间的事件,如两个事件中必有一个发生,且度,取值范围为[0,1]掷骰子点数为6仅有一个发生随机变量的概率分布01020304离散随机变量连续随机变量期望值方差随机变量可以取有限或可数无随机变量可以取任何实数值离散随机变量的数学期望或连衡量随机变量取值分散程度的穷多个值续随机变量的平均值量常见的概率分布及其性质二项分布泊松分布正态分布指数分布n次独立重复试验中成功在给定时间内发生事件连续随机变量的概率分描述随机事件发生时间k次的概率分布的次数的概率分布布,曲线呈钟形的概率分布随机变量的数字特征数学期望方差描述随机变量取值的平均水平描述随机变量取值分散程度的量协方差相关系数衡量两个随机变量共同变动的程度衡量两个随机变量线性相关程度的统计量05参数估计与假设检验点估计与区间估计点估计区间估计优缺点比较用单个数值来表示总体参提供总体参数可能存在的点估计简单直观,但缺乏数的估计值,如使用样本范围,如估计总体均值的精度;区间估计能够提供均值来估计总体均值95%置信区间更全面的信息,但计算较为复杂参数的假设检验假设检验的基本原理根据样本数据对总体参数提出假设,然后利用适当的统计量进行检验,判断假设是否成立常见参数检验方法如t检验、Z检验、卡方检验等,适用于不同类型的数据和不同的参数检验问题假设检验的步骤包括提出假设、选择合适的统计量、确定临界值、做出推断结论等步骤非参数假设检验方法非参数检验的优点适用于更广泛的数据类型和分布形非参数检验的概念式,不受总体分布限制不依赖于总体分布的具体形式,只利用样本数据本身的信息进行检验非参数检验的方法如符号检验、秩次检验、Wilcoxon秩和检验等,适用于不同类型的数据和问题06回归分析一元线性回归分析总结词详细描述一元线性回归分析是研究一个因变量与一元线性回归分析通过建立线性回归方程一个自变量之间线性关系的统计方法来描述因变量和自变量之间的平均变化关VS系,并预测因变量的取值这种方法适用于因变量和自变量之间存在直线关系的场景,如身高与年龄的关系多元线性回归分析总结词多元线性回归分析是研究多个因变量与多个自变量之间线性关系的统计方法详细描述多元线性回归分析通过建立多元线性回归方程来描述多个因变量和多个自变量之间的平均变化关系,并预测因变量的取值这种方法适用于多个因变量和多个自变量之间存在直线关系的场景,如收入与教育程度、工作经验和职业的关系非线性回归分析总结词非线性回归分析是研究非线性关系的统计方法详细描述非线性回归分析通过建立非线性回归方程来描述因变量和自变量之间的非直线关系,并预测因变量的取值这种方法适用于因变量和自变量之间存在非直线关系的场景,如药物剂量与治疗效果的关系回归分析的应用与注意事项总结词详细描述回归分析在各个领域都有广泛的应用,但在应用时需回归分析在经济学、金融学、生物学、医学和社会科要注意其假设和限制学等领域都有广泛的应用,可以帮助研究者了解变量之间的关系,并进行预测和决策然而,回归分析也有其假设和限制,如线性关系、误差项的独立同分布等在应用回归分析时,需要注意这些假设的合理性,并选择合适的回归模型进行分析同时,也需要注意对结果的解释和应用,避免过度解释或误用结果THANKS感谢观看。
个人认证
优秀文档
获得点赞 0