还剩13页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
实验课程名称—多元统计分析一判别实验成绩分析实验项目名称实验者统计学0801组另U专业班级同组者实验日期年月日非标准化系数组质心处的函数函数12总体1-
5.
958.
21521.265-.
66734.
693.452分类结果预测组成员总体123合计初始计数150005020491503044650%
1100.
0.
0.
0100.
02.
098.
02.
0100.03,
08.
092.
0100.0交叉验计数
150005004825020446503100.
0.
0.
0100.
01.
096.
04.
0100.
02.
08.
092.
0100.03第三部分结果与讨论(可加页)
一、实验结果分析(包括数据处理、实验现象分析、影响因素讨论、综合分析和结论等)
二、小结、建议与体会
三、思考题在(X2,X4)变量空间对数据作图,这三组数据是否表现为正态分布?从散点图中可以看出,三个总体的散点图都是椭圆形的因此各个总体服从二元正态分布但是三个总体中总体1的散点图的轴的方向和总体
2.总体3的方向并不一样,说明从不同的总体观测数据会得到不同的协方差矩阵假定总体来自有相同协方差矩阵的二元正态总体假设检验H0U1=U2=U3,Hl至少有一个Ui与其他均值不同,显著性水平取a=
0.
05.在这种情况下,关于协方差矩阵的假定是否合理?请解释从均值均等性的检验中得到Sig
0.05,所以拒绝原假设由从BoxM检验和散点图得到的关于公共协方差矩阵的假定是不合理的假定总体服从正态分布,构造由式(11-47)给出的二次判别得分,假定o用法则(11-48)将分类总体
1.2或者3中三个总体的得分表达式如下总体1:-
3.68+
6.16-
47.60+
23.71+
2.30-
37.67总体2:—
9.09+
19.57-
22.87+
24.94+
7.63-
36.53总体3:-
6.76+
8.54-
9.32+
22.92+
12.38-
44.04三个总体的得分依次为T
03.
77、
0.
043.-
1.23,因此将判入总体
2.(d)假定协方差矩阵对三个二元正态总体均值相同构造由所给的线性判别得分,并根据式(1-52)将分类到总体
1、2或者3中与(c)中的结果比较你倾向于那种方法?请解释三个总体得分表达式如下总体1:
36.02-
22.26-
59.00=
28.12总体2:
19.31+
16.58-
37.73=
58.86总体3:
15.49%+
36.28%4-
59.784(%)=
57.92因此将判入总体2中和(c)的结果一样,如果要选择一种方法,那么应该选择式(1—51)的方法,因为在能保证结果的一致性情况下计算要相对简单得多(e)假定三个总体的均值均为二元正态总体,有相同的协方差,且用法则(11-56)分类到总体
1、2或者3中将结果与(d)比较得分表12310-
30.74-
29.
80230.
7400.
94129.80-
0.940因此将%=[
3.5,
1.75]判入总体2中f用d中的出的线性判别函数将样本观测值分类计算APER和EAER1+42+40APER二士—=
0.03315015八/、2+4E AER=—=
0.04150总结通过一系类方法的判别我们最终的结果是一致,一方面说明我们所用的各种方法尤其共同点的一面,另一方面也让我们知道如何选择正确的方法才能更有效率的去判别分析总体上判别分析的效率还是比较高总结通过一系类方法的判别我们最终的结果是一致,一方面说明我们所用的各种方法尤其共同点的一面,另一方面也让我们知道如何选择正确的方法才能更有效率的去判别分析总体上判别分析的效率还是比较高总结通过一系类方法的判别我们最终的结果是一致,一方面说明我们所用的各种方法尤其共同点的一面,另一方面也让我们知道如何选择正确的方法才能更有效率的去判别分析总体上判别分析的效率还是比较高第一部分实验预习报告(包括实验目的、意义,实验基本原理与方法,主要仪器设备与耗材,实验方案与技术路线等)实验目的理解掌握SPSS软件中有关判别分析的基本操作;了解不同判别方法的原理与操作过程;能够用软件实际问题进行分类实验基本原理判别分析是根据观察或测量到的若干变量值判断研究对象如何分类的方法判别分析是在已知分类数目的情况下,根据一定的指标对不知道的数据进行归类判别分析的目的是得到体现分类的函数关系式,即判别函数基本思想是在已知观测对象的分类和特征变量值得前提下,从中筛选出能提供较多信息的变量,并建立判别函数;目标是是得到的判别函数在对观测量进行判别其所属类别时的错判概率最小判别函数的一般形式是其中,y为判别分数判别值;为反映研究对象特征的变量;丁=/+%々1+—+3为个变量的系数,即判别系数常用的判别方法有距离判别法、Fisher判别法和贝叶斯判别法等Bayes判别法假定对所研究的对象已有一定的认识,常用先验概率来描述这种认识设有k个总体Gl,G2,…,Gk,它们的先验概率分别为(它们可以由经验给出也可以估出)各总体的密度函数分别为(在离散情形是概率函数),在观测到一个样品x的情况下,可用著名的Bayes公式计算它来自第g总体的后验概率(相对于先验概率来说,将它又称为后验概率):)g=L・・・,km/、qjg p(g/x)=T^一£qf(x)i=\P(h/x)=max P(g/x)IWgWk并且当时,则判X来自第h总体距离判别法首先计算X到Gl、G2总体的距离,分别记为和,按距离最近准则判别归类,则可写成,当X当,〉待判,当X GG ZX,G1DX,Ge G2,X GDX02X,G1=QX,G22题目表n.5的数据包含三种莺尾的X2二萼片宽度与X4二花瓣的宽度的观测值对每种莺尾有nl=n2=n3=50个观测值部分数据:第二部分实验过程记录(可加页)(包括实验原始数据记录,实验现象记录,实验过程发现的问题等)散点图图形一旧对话框一散点图,打开简单散点图子对话框;将想X2选入X轴变量,X4选入Y轴变量,将总体选入设置标记框中,点击确定总体O
10232.5-
2.0-花浦筹
0.0-I I I III
2.
02.
53.
03.
54.
04.5萼片宽度X2判别分析:步骤
1、选择分析一分类一判别,打开判别分析子对话框
2、选择变量“总体”,单击一,将其加入到分组变量栏中
3、打开定义范围子对话框,最小值输入1,最大值输入
34、将变量“X2萼片宽度”、“X4花瓣的宽度”选入自变量栏中选择“一起输入自变量”的方法X
45、打开统计变量子对话框,选择均值、单变量ANOVA.Box M、未标准化、组内协方差、分组协方差与总体协方差,单击继续打开分类子对话框,选择不考虑该个案时的分类,其余为默认值打开保存,选择所有的变量组统计量有效的N(列表状态)未加权已加权的的总体均值标准差1萼片宽度
3.428,
37915050.000X2花瓣宽度.
246.
10545050.000X42萼片宽度
2.
770.
31385050.000X2花瓣宽度
1.
326.
19785050.000X43萼片宽度
2.
974.
32255050.000X2花瓣宽度
2.
026.
27475050.000X4合计萼片宽度
3.
057.
4359150150.000X2花瓣宽度
1.
199.
7622150150.000X4组均值的均等性的检验Wilks的LambdaFdfl df2Sig.萼片宽度.
59949.1602147,000X2花瓣宽度.
071960.
0072147.000X4协方差矩阵萼片宽度花瓣宽度X2X4总体萼片宽度
1.
144.009X2花瓣宽度.
009.011X42萼片宽度.
098.041X2花瓣宽度.
041.039X43萼片宽度.
104.048X2花瓣宽度.
048.075X4合计萼片宽度.190-122X2花瓣宽度-
122.581X4a.总的协方差矩阵的自由度.149相关系数矩阵萼片宽度花瓣宽度X2X4总体合计萼片宽度.190-122X2花瓣宽度-
122.581X4对数行列式对数行列式总体秩12-
6.49622-
6.14132-
5.189汇聚的组2-
5.583内检验结果箱的
52.832MF近似
8.632dfl6df
2538562.769Sig..000Wilks的Lambda函数Wilks的检验Lambda卡方df Sig.1到,
038477.
8684.
00022.
80931.
0751.000典型判别式函数系数函数12萼片宽度-
1.
9872.680X2花瓣宽度
5.
477.817X4一.49(常量)-
9.1744。
个人认证
优秀文档
获得点赞 0