还剩2页未读,继续阅读
文本内容:
模式识别miniproject实验报告
一、算法介绍:本实验采用了SVMSupport VectorMachines分类模型由于实际问题中很少线性可分,故本实验采用非线性SVM方法即通过一个适当的非线性映射功,将数据由原始特征空间映射到一个新特征空间,然后在新空间中寻求最优线性判定面本实验选取的的核函数为RBF径向基函数中的高斯核函数,即kx,y exp-
0.5*normx-y/s A2o关于支持向量机的类型,本实验选取为二类分类算法,即svc_c算法方面,由于同时求解〃个拉格朗日乘子涉及很多次迭代,计算开销太大,所以实验采用Sequential MinimalOptimizationSMO算法,即每次只更新两个乘子,迭代获得最终解计算时,首先根据预先设定的规则,从所有样本中选出两个拉格朗日因子,然后保持其他拉格朗日乘子不变,更新所选样本对应的拉格朗日乘子,循环N次直到满足要求
二、实验、评价标准1本实验采用正确率来作为评价指标,即TPR xN++TNR xN-accuracy=-----------_^-N+N、整体试验方法及步骤21定义核函数的类型及相关参数;2构建两类训练样本考虑到实验程序运行时间问题,本实验只选用了testdata的第200至1200项共1000个作为训练样本3训练支持向量机;4寻找支持向量;5测试输出;6计算评价指标,即正确率、分类器训练算法的参数调整步骤31随机生成多个参数向量解2在目标函数上验证解的质量3根据解的质量由好到坏进行排序取出其中较好的一部分例如一半解,在这些解的每一个元素上加上一个随机数,从而得到一些新解4把新解和老解比较,取出最好的一部分,作为下一次迭代的初始解、实验结果4经实验,得到测试输出,将其第十一列,即样本类别与testdata中的第十三列相比,即可得到正确率本实验将以上结果取于EXECL中进行统计,部分结果截图如下其中,A列为测试输出末列,B为testdata末列,C为二者之和」B」A C1________11-1▼211231it-104i125i126i|_-1071it128i1________219i1210司12图1输出统计对比图部分数据总共2072个,其中C列经删选,得CR的项为744个,故正确率为2072-744/2072=
64.09%后经多次实验,结果相差不多,故0不再列出
10.
80.
60.
40.20-
0.2-
0.4-
0.6-
0.8-1-1-
0.8-
0.6-
0.4-
0.
200.
20.
40.
60.81图2测试输出分布图。
个人认证
优秀文档
获得点赞 0