还剩20页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
《做判别分析》ppt课件目录•判别分析简介•判别分析的数学原理•判别分析的实例•判别分析的优缺点•判别分析的应用场景01判别分析简介Chapter判别分析的定义判别分析是一种统计方法,用于根据已知分类的数据集来建立分类模型,以便对新的未知分类数据进行分类01它通过确定观察值所属类别的主要统计量,利用这些统计量来预测新观察值的类别02判别分析的用途01020304金融市场调研生物医学农业信用评分、风险评估消费者分类、市场细疾病诊断、生物标记作物分类、害虫识别分识别判别分析的步骤对数据进行清理、缩使用适当的评估指标,放和编码等操作,以如准确率、混淆矩阵满足判别分析的要求等,对模型进行评估和优化数据预处理模型评估收集数据模型建立模型应用选择合适的样本和变选择适合的判别函数,将模型应用于新数据,量,确保数据质量和确定分类标准,建立进行分类预测完整性判别模型02判别分析的数学原理Chapter距离度量欧氏距离曼哈顿距离最常见的距离度量方式,适用于连续只考虑数据在坐标轴上的绝对差值,型变量计算公式为$d=适用于离散型变量计算公式为$dsqrt{x_2-x_1^2+y_2-=|x_2-x_1|+|y_2-y_1|$y_1^2}$马氏距离考虑到数据的协方差,适用于具有不同方差和均值的数据集计算公式为$d=sqrt{x_2-x_1^2+y_2-y_1^2+z_2-z_1^2}$贝叶斯定理010203基本思想公式表示应用场景基于先验概率和似然函数,$PA|B=frac{PB|A在判别分析中,贝叶斯定计算后验概率times PA}{PB}$理常用于分类问题,特别是当类别先验概率未知时判别函数类型线性判别函数和非线性判别函数定义判别函数是根据训练数据集建立的数学模型,用于预测新数据点的类别线性判别函数公式$y=w_1x_1+w_2x_2+...+w_nx_n+b$03判别分析的实例Chapter数据准备收集数据数据清洗数据探索根据研究目的和问题,选对数据进行预处理,包括初步了解数据分布、特征择合适的数据源,并收集缺失值处理、异常值处理、间的关系等,为后续建模相关数据数据类型转换等提供依据建立模型确定变量模型选择模型拟合根据研究目的和数据特征,选择根据数据特点和问题类型,选择使用选定的模型对数据进行拟合,与分类结果相关的变量作为预测合适的判别分析模型得到判别函数因子结果解释分类结果根据判别函数对新的观测值进行分类,得到分类结果评估指标计算分类结果的准确率、混淆矩阵等指标,对模型效果进行评估结果解释解释判别函数的意义,说明分类的依据和合理性04判别分析的优缺点Chapter优点判别分析是一种有效的统计方法,有效性能够根据已知分类的数据,构建预测模型,对新数据进行分类判别分析的算法相对简单,容易简单易用理解和实现,不需要复杂的数学背景判别分析的结果通常具有很强的可解释性强可解释性,能够提供各个特征对分类的影响程度判别分析可以处理多分类问题,处理多分类问题而不仅仅是二分类问题缺点对数据分布假设敏感对特征选择敏感判别分析通常假设数据服从多元判别分析对特征的选择较为敏感,正态分布,如果数据分布不符合如果选择的特征不恰当,可能会01这个假设,可能会导致分析结果影响分类效果不准确0203对数据量要求较高对异常值敏感判别分析通常需要较大的数据量判别分析对异常值比较敏感,异才能获得稳定和准确的结果常值可能会影响分析结果0405判别分析的应用场景Chapter金融风控信用评估利用判别分析对借款人的信用状况进行评估,以降低坏账风险风险预警通过判别分析识别潜在的风险因素,及时发出预警,避免损失欺诈检测利用判别分析检测异常交易和欺诈行为,保障资金安全医学诊断疾病分类利用判别分析对疾病进行分类,提高诊断准确率1预后预测通过判别分析预测患者的预后情况,为治疗提供2参考药物研发利用判别分析筛选有效药物成分,加速药物研发3进程市场细分消费者行为分析01利用判别分析对消费者行为进行细分,制定更有针对性的营销策略市场趋势预测02通过判别分析预测市场趋势,提前布局产品和服务竞争者分析03利用判别分析识别竞争者的优势和劣势,制定更有针对性的竞争策略THANKS感谢观看。
个人认证
优秀文档
获得点赞 0