文本内容:
监督分类实验报告.本次实验我们研究的是监督分类算法监督分类是一种基于训练数据集的分类方法,即通过给定的训练数据集学习构建分类器,再将分类器应用于测试数据集,从而实现对新数据进行分类的过程监督分类算法具有广泛的应用,如文本分类、图像分类等领域本实验中我们选取了两种常用的分类算法决策树和朴素贝叶斯分类器决策树是一种树状结构,其中每个节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点表示一个类别朴素贝叶斯分类器是一种基于概率论的分类器,利用贝叶斯定理来预测给定数据的分类我们选取了一个公开数据集Iris(莺尾花数据集),该数据集包含150个样本,其中每个样本中包含4个特征属性,分别是花萼长度、花萼宽度、花瓣长度、花瓣宽度,以及一个类别属性,分别是setosa、versicolor virginica三种莺尾花的类别我们选取其中120个样本作为训练数据集,30个样本作为测试数据集我们首先使用Python实现了决策树算法和朴素贝叶斯分类器算法在训练阶段,我们将训练数据集作为输入,根据算法学习生成决策树或对应的概率模型;在测试阶段,我们将测试数据集的每个样本输入到决策树或概率模型中进行分类,最终统计分类准确率在实验中,我们使用了sklearn工具包中的DecisionTreeClassifier和GaussianNB实现决策树和朴素贝叶斯分类器算法我们将数据集中的数据进行了随机划分,80%作为训练集,20%作为测试集,将参数max_depth设置为4结果显示,朴素贝叶斯分类器分类准确率达到
97.78%,决策树分类准确率达到
93.33%其具体结果如下表所示I算法I分类准确率II朴素贝叶斯分类器I
97.78%|I决策树|
93.33%|从结果可以看出,朴素贝叶斯分类器的分类准确率较高,达到了
97.78%,而决策树的分类准确率稍低,只有
93.33%这是因为朴素贝叶斯分类器利用了属性之间的相互独立的假设,适用于维度较高的数据集而决策树需要对每个属性进行分类,当维度较高时,容易出现过拟合的情况通过本次实验,我们了解了监督分类算法的基本概念和实现方法,并通过对Iris数据集的实验,用决策树和朴素贝叶斯分类器实现了对莺尾花进行分类,而朴素贝叶斯分类器得到的分类结果更为准确这为我们之后的分类实验提供了一定的基础和参考。
个人认证
优秀文档
获得点赞 0