还剩6页未读,继续阅读
文本内容:
《缺失与比较》课件PPT探究缺失的本质,针对常见的缺失与比较方法进行分析和比较,为解决实际问题提供参考背景介绍什么是缺失?缺失是研究中不完整或缺乏的数据,给数据分析、研究带来了困难缺失的类型分为随机缺失、非随机缺失、完全缺失等类型缺失数据的影响缺失数据会导致模型预测不准确,影响研究结果的可信度重要性和应用场景医疗研究金融分析市场调查由于医学研究的限制,有些数据缺失数据会影响模型预测,影响市场调查中,有些参与者不会回很难获取,缺失数据的影响很大投资决策中的风险估算答全部问题,就会导致数据缺失常见的缺失与比较方法列表删除法插补法模型预测法从数据集中把有缺失的全部删通过已有的数据推断缺失值,通过已有数据建模,预测缺失除,优点是不会对其他数据产常用的方法包括均值插补、多值,比插补法更加精准,但需生影响,缺点是会因数据量的重插补等等,缺点是会导致插要对模型的准确性进行评估减少而降低模型表现力入的数据带来误差案例研究案例11通过数据插值法插值处理,得到的预测值和实测值的误差小于,模型表现较好10%案例22对缺失数据和非缺失数据进行区分,建立多模型方法预测模型,得到了较高的精准度案例33通过添加其他变量,将缺失数据列进行转化处理,通过模型精度的验证,得到了不错的结果优缺点分析插补法优点插补法缺点12适用于数据集中缺失较少的情况,计算简单,会引入误差,不适用于数据集中缺失值比较运算成本低多的情况,会导致精度降低基于模型的法优点基于模型的法缺点34根据相关数据集进行建模预测,比较精确建模过程复杂,对数据集要求较高总结缺失数据的分析和填补是数据处理中的重要一环,选择合适的方法能够提高模型预测的准确性,对于数据处理人员,需要灵活运用相关方法参考资料卢钧容,刘丽洁,多重插补技术在情感数据处理中的应用,《系统工程》,年,•“”20205118-124赵光明,刘志超,基于极大似然估计的缺失数据处理研究,《智能信息学》,年,•“”20217113-131宋长泽,周维清,缺失值处理的研究与比较,《中国统计学报》,年,•“”20181102-117。
个人认证
优秀文档
获得点赞 0